构建用户画像的目的很简单:了解你,是为了更好的服务你

构建用户画像的目的很简单:了解你,是为了更好的服务你
构建用户画像的目的很简单:了解你,是为了更好的服务你

企业利用寻找到的目标用户群,挖掘每一个用户的人口属性、行为属性、社交网络、心理特征、兴趣爱好等数据,经过不断叠加、更新,抽象出完整的信息标签,组合并搭建出一个立体的用户虚拟模型,即用户画像。

给用户“打标签”是用户画像最核心的部分。所谓“标签”,就是浓缩精炼的、带有特定含义的一系列词语,用于描述真实的用户自身带有的属性特征,方便企业做数据的统计分析。

出于不同的受众群体、不同的企业、不同的目的,给用户打的标签往往各有侧重点,应该具体问题具体看待。

但是,有些标签适用于所有情况,应该加以理解和掌握。我把常见的标签分成两大类别:相对静止的用户标签以及变化中的用户标签。

相对应的,由静态标签搭建形成的画像就是2D用户画像;由静态标签+动态标签构建出来的即是3D 用户画像。

静态的用户信息标签以及2D用户画像

人口属性标签是用户最基础的信息要素,通常自成标签,不需要企业过多建模,它构成用户画像的基本框架。

人口属性包括人的自然属性和社会属性特征:姓名、性别、年龄、身高、体重、职业、地域、受教育程度、婚姻、星座、血型……。自然属性具有先天性,一经形成将一直保持着稳定不变的状态,比如性别、地域、血型;社会属性则是后天形成的,处于相对稳定的状态,比如职业、婚姻。

心理现象包括心理和个性两大类别,同样具有先天性和后天性。对于企业来说,研究用户的心理现象,特别是需求、动机、价值观三大方面,可以窥探用户注册、使用、购买产品的深层动机;了解用户对产品的功能、服务需求是什么;认清目标用户带有怎样的价值观标签,是一类什么样的群体。

具体的心理现象属性标签包括但不限于:

来源:“心理现象”百度百科

因为人口属性和心理现象都带有先天的性质,整体处于稳定状态,共同组成用户画像最表面以及最

内里的信息素,由此形成稳定的2D用户画像。

2D用户画像

动态的用户信息标签以及3D用户画像

网站行为属性,这里我们主要讨论的是用户在网站内外进行的一系列操作行为。常见的行为包括

:搜索、浏览、注册、评论、点赞、收藏、打分、加入购物车、购买、使用优惠券……。

在不同的时间,不同的场景,这些行为不断发生着变化,它们都属于动态的信息。企业通过捕捉用户的行为数据(浏览次数、是否进行深度评论),可以对用户进行深浅度归类,区分活跃/不活跃用户。

社交网络行为,是指发生在虚拟的社交软件平台(微博、微信、论坛、社群、贴吧、twitter、Instagram)上面一系列用户行为,包括基本的访问行为(搜索、注册、登陆等)、社交行为(邀请/添加/取关好友、加入群、新建群等)、信息发布行为(添加、发布、删除、留言、分享、收

藏等)。

给用户打上不同的行为标签,可以获取到大量的网络行为数据、网站行为数据、用户内容偏好数据、用户交易数据。这些数据进一步填充了用户信息,与静态的标签一起构成完整的立体用户画像,就是所说的3D用户画像。

3D用户画像

用户画像的价值

企业必须在开发和营销中解决好用户需求问题,明确回答“用户是谁——用户需要/喜欢什么——哪些渠道可以接触到用户——哪些是企业的种子用户”。

更了解你,是为了更好的服务你!可以说,正是企业对用户认知的渴求促生了用户画像。

用户画像是真实用户的缩影,能够为企业带来不少好处。

指导产品研发以及优化用户体验

在过去较为传统的生产模式中,企业始终奉行着“生产什么就卖什么给用户”的原则。这种闭门造车的产品开发模式,常常会产生“做出来的东西用户完全不买账”的情况。

如今,“用户需要什么企业就生产什么”成为主流,众多企业把用户真实的需求摆在了最重要的位置。

在用户需求为导向的产品研发中,企业通过获取到的大量目标用户数据,进行分析、处理、组合,初步搭建用户画像,做出用户喜好、功能需求统计,从而设计制造更加符合核心需要的新产品,为用户提供更加良好的体验和服务。

实现精准化营销

精准化营销具有极强的针对性,是企业和用户之间点对点的交互。它不但可以让营销变得更加高效

,也能为企业节约成本。

以做活动为例:商家在做活动时,放弃自有的用户资源转而选择外部渠道,换而言之,就是舍弃自家精准的种子用户而选择了对其品牌一无所知的活动对象,结果以超出预算好几倍的成本获取到新用户。

这就是不精准所带来的资源浪费。

包括我前面所提到的,网购后的商品推荐以及品牌商定时定点的节日营销,都是精准营销的成功示范。

要做到精准营销,数据是最不可缺的存在。以数据为基础,建立用户画像,利用标签,让系统进行智能分组,获得不同类型的目标用户群,针对每一个群体策划并推送针对性的营销。

可以做相关的分类统计

简单来说,借助用户画像的信息标签,可以计算出诸如“喜欢某类东西的人有多少”、“处在25到30岁年龄段的女性用户占多少”等等。

便于做相关的数据挖掘

在用户画像数据的基础上,通过关联规则计算,可以由A可以联想到B。

沃尔玛“啤酒和尿布”的故事就是用户画像关联规则分析的典型例子。

资料来源:“关联规则”百度百科

我们认识到用户画像具有的极高价值,下面就来看看该如何搭建用户画像。

如何构建用户画像

用户画像准备阶段——数据的挖掘和收集

对网站、活动页面进行SDK埋点。即预先设定好想要获取的“事件”,让程序员在前/后端模块使用Java/Python/PHP/Ruby 语言开发,撰写代码把“事件”埋到相应的页面上,用于追踪和记录的用户的行为,并把实时数据传送到后台数据库或者客户端。

所谓“事件”,就是指用户作用于产品、网站页面的一系列行为,由数据收集方(产品经理、运营人员)加以描述,使之成为一个个特定的字段标签。

我们以“网站购物”为例,为了抓取用户的人口属性和行为轨迹,做SDK埋点之前,先预设用户购物时的可能行为,包括:访问首页、注册登录、搜索商品、浏览商品、价格对比、加入购物车、收藏商品、提交订单、支付订单、使用优惠券、查看订单详情、取消订单、商品评价等。

把这些行为用程序语言进行描述,嵌入网页或者商品页的相应位置,形成触点,让用户在点击时直接产生网络行为数据(登陆次数、访问时长、激活率、外部触点、社交数据)以及服务内行为数据(浏览路径、页面停留时间、访问深度、唯一页面浏览次数等等)。

数据反馈到服务器,被存放于后台或者客户端,就是我们所要获取到的用户基础数据。

然而,在大多数时候,利用埋点获取的基础数据范围较广,用户信息不够精确,无法做更加细化的分类的情况。比如说,只知道用户是个男性,而不知道他是哪个年龄段的男性。

在这种情况下,为了得到更加详细的,具有区分度的数据,我们可以利用A/B test。

A/B test就是指把两个或者多个不同的产品/活动/奖品等推送给同一个/批人,然后根据用户作出的选择,获取到进一步的信息数据。

为了知道男性用户是哪个年龄层的,借助A/B test,我们利用抽奖活动,在奖品页面进行SDK埋

点后,分别选了适合20~30岁和30~40岁两种不同年龄段使用的礼品,最后用户选择了前者,于是我们能够得出:这是一位年龄在20~30岁的男性用户。

以上就是数据的获取方法。有了相关的用户数据,我们下一步就是做数据分析处理——数据建模。用户画像成型阶段——数据建模

1、定性与定量相结合的研究方法

定性化研究方法就是确定事物的性质,是描述性的;定量化研究方法就是确定对象数量特征、数量关系和数量变化,是可量化的。

一般来说,定性的方法,在用户画像中,表现为对产品、行为、用户个体的性质和特征作出概括,形成对应的产品标签、行为标签、用户标签。

定量的方法,则是在定性的基础上,给每一个标签打上特定的权重,最后通过数学公式计算得出总的标签权重,从而形成完整的用户模型。

所以说,用户画像的数据建模是定性与定量的结合。

2、数据建模——给标签加上权重

给用户的行为标签赋予权重。

用户的行为,我们可以用4w表示: WHO(谁);WHEN(什么时候);WHERE(在哪里)

;WHAT(做了什么),具体分析如下:

WHO(谁):定义用户,明确我们的研究对象。主要是用于做用户分类,划分用户群体。网络上的用户识别,包括但不仅限于用户注册的ID、昵称、手机号、邮箱、身份证、微信微博号等等。

WHEN(时间):这里的时间包含了时间跨度和时间长度两个方面。“时间跨度”是以天为单位计算的时长,指某行为发生到现在间隔了多长时间;“时间长度”则为了标识用户在某一页面的停留时间长短。

越早发生的行为标签权重越小,越近期权重越大,这就是所谓的“时间衰减因子”。

WHERE(在哪里):就是指用户发生行为的接触点,里面包含有内容+网址。内容是指用户作用于的对象标签,比如小米手机;网址则指用户行为发生的具体地点,比如小米官方网站。权重是加在网址标签上的,比如买小米手机,在小米官网买权重计为1,,在京东买计为0.8,在淘宝买计为0.7。

WHAT(做了什么):就是指的用户发生了怎样的行为,根据行为的深入程度添加权重。比如,用户购买了权重计为1,用户收藏了计为0.85,用户仅仅是浏览了计为0.7。

当上面的单个标签权重确定下来后,就可以利用标签权重公式计算总的用户标签权重:

标签权重=时间衰减因子×行为权重×网址权重

举个栗子:A用户今天在小米官网购买了小米手机;B用户七天前在京东浏览了小米手机。

由此得出单个用户的标签权重,打上“是否忠诚”的标签。

通过这种方式对多个用户进行数据建模,就能够更广的覆盖目标用户群,为他们都打上标签,然后按照标签分类:总权重达到0.9以上的被归为忠实用户,ta们都购买了该产品……。这样的一来,企业和商家就能够根据相关信息进行更加精准的营销推广、个性化推荐。

有关用户画像的介绍到此就告一段落了,鉴于自身能力有限,很多地方表达的不到位或者没有提及,有啥意见或者建议欢迎留言!

作者:草莓君,广州麦多网络科技有限公司新媒体运营人员,负责运营微信公众号“活动

盒子”(huodonghezi_com),致力于做有节操的运营汪、优雅的文案狗,正在努力成长中。

人人都是产品经理(https://www.360docs.net/doc/9b13482469.html,)中国最大最活跃的产品经理学习、交流、分享平台

基于大数据的用户画像构建(理论篇)

基于大数据的用户画像构建(理论篇) ◎什么是用户画像? 简而言之,用户画像是根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。 举例来说,如果你经常购买一些玩偶玩具,那么电商网站即可根据玩具购买的情况替你打上标签“有孩子”,甚至还可以判断出你孩子大概的年龄,贴上“有5-10岁的孩子”这样更为具体的标签,而这些所有给你贴的标签统在一次,就成了你的用户画像,因此,也可以说用户画像就是判断一个人是什么样的人。

除去“标签化”,用户画像还具有的特点是“低交叉率”,当两组画像除了权重较小的标签外其余标签几乎一致,那就可以将二者合并,弱化低权重标签的差异。 ◎用户画像的作用 罗振宇在《时间的朋友》跨年演讲上举了这样一个例子:当一个坏商家掌握了你的购买数据,他就可以根据你平常购买商品的偏好来决定是给你发正品还是假货以提高利润。且不说是否存在这情况,但这也说明了利用用户画像可以做到“精准销售”,当然了,这是极其错误的用法。 其作用大体不离以下几个方面: 1.精准营销,分析产品潜在用户,针对特定群体利用短信邮件等方式进行营销; 2.用户统计,比如中国大学购买书籍人数TOP10,全国分城市奶爸指数; 3.数据挖掘,构建智能推荐系统,利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌,利用聚类算法分析,喜欢红酒的人年龄段分布情况; 4.进行效果评估,完善产品运营,提升服务质量,其实这也就相当于市场调研、用户调研,迅速下定位服务群体,提供高水平的服务; 5.对服务或产品进行私人定制,即个性化的服务某类群体甚至每一位用户(个人认为这是目前的发展趋势,未来的消费主流)。比如,某公司想推出一款面向5-10岁儿童的玩具,通过用户画像进行分析,发现形象=“喜羊羊”、价格区间=“中等”的偏好比重最大,那么就给新产品提供类非常客观有效的决策依据。 6.业务经营分析以及竞争分析,影响企业发展战略

产品经理必备技能之用户画像

产品经理必备技能之用户画像 用户画像说简单点就是要你虚构出一个产品的用户,设定用户性别、年龄、收入、家庭等基本情况进行场景模拟。通过用户画像,我们可以将产品用户具体化、形象化,从而更好地理解产品用户,设计出更加符合用户需求的产品。 那么用户画像怎么做? 用户画像的应用场景 在产品生命周期的各个阶段,我们可以通过用户画像形象生动表达的需求,让产品经理及团队成员有进一步的思考。通过用户画像,了解产品的用户是谁、用户希望产品可以做什么以及用户在使用产品过程当中做了什么。我们可以根据这三个目的,把用户画像分为一下三种应用场景: 1.了解用户是谁 在产品的BRD文档编写阶段和产品构想阶段,产品经理最关注的就是产品的用户、需求、场景,通过三要素判断产品的构想是否成立以及将产品的解决方案向boss进行汇报。 用户画像包含元素: 基本属性:照片、姓名、年龄、职业、爱好等; 需求:目前需要满足的需求; 用户故事:虚拟产品的使用场景,例如用户会在生命情况下使用产品。 数据来源: 有些产品新人可能会问,用户画像中的信息从哪里来?自己编吗?怎么可能!还是要有人物原型的。在这里对于用户信息的收集有几种方式: 1)通过行业分析报告分析、获取产品的用户信息、用户需求,进行信息整个形成用户画像2)通过用户访谈、问卷调查等方式收集用户信息及需求,根据调查结果形成用户画像 实战:关于外卖类产品的用户画像 2.用户希望产品可以做什么 在产品设计阶段,产品经理需要将产品的设计思路、构想提交给各个团队进行产品设计开发。那么如何能让设计开发团队清晰理解你想表达的思想以及用户的真实需求,这时就需要用户

画像进行辅助说明。通常以PRD、原型图为主,用户画像为辅。 用户画像包含元素: 基本属性:照片、姓名、年龄、职业、爱好等; 使用场景:明确产品使用是移动端还是PC端,什么情况下使用,设计产品性能,用户体验用户故事:描述用户任务以及用户完成任务时的产品使用路径。 数据来源: 在产品设计阶段已经明确了用户的需求及使用场景,那么关于用户故事的描述可以总结为一下两点:, 1)对用户进行访谈和问卷调查, 2)可以邀请目标用户对产品原型进行模拟使用,了解用户的使用方式和行为,设计出更符合用户习惯的产品。 实战:关于女性电商产品用户画像 3.用户在使用产品过程中做了什么 了解用户行为也可以叫做用户研究,关于用户研究的内容就比较广泛了,比如用户数据挖掘分析、用户流失行为分析、用户推荐等等,根据你的目的不同可以建立不同种类的用户画像。通常在这个阶段的用户画像都建立在产品上线运营了一段时间,希望从某一个具体方面对某一类用户行为进行具体研究、分析,提出针对这一类用户的解决或推荐方案。 用户画像包含元素: 基本属性:照片、姓名、年龄、职业、爱好等; 使用行为:用户使用产品时的行为或特点,通过寻找共性发现你希望找到的一类用户 用户故事:目的在找到符合这类使用习惯的用户群体 数据来源: 这时,产品已经运营一段时间了,使用行为的来源是通过产品后台收集到的数据分析得来,然后再将用户行为特点放入后台数据库中得到一类用户的具体数据。 实战:关于国际漫游业务用户推荐

快速构建用户画像

思路+步骤+方法,三步教你如何快速构建用户画像 如果你走在大街上,看到迎面走来了一个前凸后翘、长发飘飘、五官精致、皮肤白皙、大腿修长的人,你内心肯定会一阵惊喜:“哇,美女!”。假如你对这个美女产生了兴(性)趣,你想追求这个美女,那么你会想办法去了解这个美女,比如约她吃饭,出去玩以了解她的性格特征,从她闺蜜那打听她的兴趣、爱好等。当你对这个美女的外在和内在都做了详细的了解之后,你觉得的实时机差不多了,就开始了对美女的表白。 其实在你向美女表白前的一些列过程就是在对这个美女进行画像。你在表白前你肯定会对这个美女有了以下判断: 外在,她是一个美女。判断依据:前凸后翘,长发飘飘,五官精致,皮肤白皙,大腿修长 内在,她很温柔、贤惠、知书达理,她喜欢……判断依据:声音好听、细腻,举止优雅,会做饭,能持家,善解人意等 其实我们在做产品或者运营过程中的用户画像也是同样的道理和思路,前面是对单个人的特征描述。在做产品运营过程中的用户画像唯一不同的就是:我们需要对一群人做特征描述,是对一个群体的共性特征的提炼,说白了就是给用户群体打标签。所以用一句话概括:用户画像就是给用户打标签! 当然给用户画像不是随随便便的给用户打几个标签就完事,就像你追美女之前的了解工作一样,你需要对美女的外表进行判断,你需要通过跟美女的交往和沟通,或者从闺蜜那进行打听来了解美女的性格,爱好和需求。所以我们在构建用户画像的时候需要遵循一定的思路、步骤和方法。 用户画像的思路 前面在用美女举例的时候,对美女从内在和外在两个方面进行了判断,用户画像的构建思路其实也是从这两个方面进行展开。在这里我们称之为:显性画像和隐性画像两个方面,具体的思路都是围绕这两个方面进行展开。

建立用户画像的标签体系

建立用户画像的标签体系 王建军 前一篇粗略的介绍了建立用户画像的过程,连载二更进一步,以时尚杂志全媒体为业务原型,把抽象的文字描述实例化,从战略目的分析、如何建立用户画像体系、怎么对标签进行分类分层级三个不同角度来说说用户画像建立的过程。梳理标签体系是实现用户画像过程中最基础、也是最核心的工作,后续的建模、数据仓库搭建都会依赖于标签体系。 可以获取到的数据分两类,一类是业务系统数据,一类是用户访问网站、APP 产生的行为数据。

不同的企业做用户画像有不同的战略目的,广告公司做用户画像是为精准广告服务,电商做用户画像是为用户购买更多商品,内容平台做用户画像是推荐用户更感兴趣的内容提升流量再变现。 战略理清楚后,首先要画出描述用户画像的框架,建立用户画像体系框架的目的是进一步明确用户画像的用途、把标签限定在合理的范围内。具体要结合战略目标、数据情况、应用场景来规划标签系统,选取和战略目标一致的标签维度,把

标签按照应用场景进行分门别类。同时注意聚焦和收敛,不要把没用标签装进来,以降低系统的复杂性,避免无用信息干扰分析过程。 用户画像体系和标签分类从两个不同角度来梳理标签,用户画像体系偏战略和应用,标签分类偏管理和技术实现侧。 把标签分成不同的层级和类别,一是方便管理数千个标签,让散乱的标签体系化;二是维度并不孤立,标签之间互有关联;三可以为标签建模提供标签子集,例如计算美妆总体偏好度,主要使用美妆分类的标签集合。 梳理某类别的子分类时,尽可能的遵循MECE原则(相互独立、完全穷尽),尤其是一些有关用户分类的,要能覆盖所有用户,但又不交叉。比如:用户活跃度的划分为核心用户、活跃用户、新用户、老用户、流失用户,用户消费能力分为超强、强、中、弱,这样按照给定的规则每个用户都有分到不同的组里。

用户画像数据建模方法

用户画像数据建模方法 从1991年Tim Berners-Lee发明了万维网(World Wide Web)开始,到20年后2011年,互联网真正走向了一个新的里程碑,进入了“大数据时代”。经历了12、13两年热炒之后,人们逐渐冷静下来,更加聚焦于如何利用大数据挖掘潜在的商业价值,如何在企业中实实在在的应用大数据技术。伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传统的线下会员管理、问卷调查、购物篮分析,大数据第一次使得企业能够通过互联网便利地获取用户更为广泛的反馈信息,为进一步精准、快速地分析用户行为习惯、消费习惯等重要商业信息,提供了足够的数据基础。伴随着对人的了解逐步深入,一个概念悄然而生:用户画像(UserProfile),完美地抽象出一个用户的信息全貌,可以看作企业应用大数据的根基。 一、什么是用户画像? 男,31岁,已婚,收入1万以上,爱美食,团购达人,喜欢红酒配香烟。 这样一串描述即为用户画像的典型案例。如果用一句话来描述,即:用户信息标签化。 如果用一幅图来展现,即: 二、为什么需要用户画像 用户画像的核心工作是为用户打标签,打标签的重要目的之一是为了让人能够理解并且方便计算机处理,如,可以做分类统计:喜欢红酒的用户有多少?喜欢红酒的人群中,男、女比例是多少? 也可以做数据挖掘工作:利用关联规则计算,喜欢红酒的人通常喜欢什么运动品牌?利用聚类算法分析,喜欢红酒的人年龄段分布情况? 大数据处理,离不开计算机的运算,标签提供了一种便捷的方式,使得计算机能够程序化处理与人相关的信息,甚至通过算法、模型能够“理解” 人。当计算机具备这样的能力后,无论是搜索引擎、推荐引擎、广告投放等各种应用领域,都将能进一步提升精准度,提高信息获取的效率。 三、如何构建用户画像

大数据挖掘的用户画像应用方案

在大数据时代,机器要学会从比特流中解读用户,构建用户画像就变得尤其重要。本文介绍了用户画像的理论和实践,以及在实际中的应用。如何根据用户画像进行精准营销?将用户画像应用于个性化推荐?一起来寻找答案吧~ 首先看一下大数据与应用画像的关系,现在大数据是炙手可热,相信大家对大数据的四个V都非常了解,大数据应该说是信息技术的自然延伸,意味着无所不在的数据。 我们先看下数据地位发生转变的历史,在传统的IT时代,TI系统围绕业务服务,在这个服务的过程中沉淀了很多数据,再在数据的基础上做一些分析。但是到了DT时代不一样了,数据是现实世界的虚拟化表现,数据本身构成了一个虚拟世界,IT系统构建在虚拟系统上,变得更加智能。

大数据无处不在体现在几个方面 第一个就是说我们社会信息化的建设越来越发达。 第二个是随着可穿戴设备的发展,人产生了越来越多的数据,接入网络当中,同时人和人之间沟通的方式也不仅仅是传统的面对面,传统理解人、与人沟通的方式发生了根本的变革,因此我们要学会从比特流中去认识人类,因此构建用户画像这件事就变得更加重要。 而且现在机器也变得很智能了,所以我们还要教会机器来认识人类,这样才能在画像的基础上构建应用,譬如个性化推荐、精准广告、金融征信等等。之前我一直是在从事这方面的应用开发,因此知道用户画像对于这些应用的重要性。 如果大家是来自互联网公司的话,我们经常会提到这些词:用户画像、标签、360度用户视图等等,有不少人甚至就是做这面的研发工作,但是这些概念让你感觉有一点似是而非,我以前也有这样的感觉,就是说没有从根本上把这些概念弄清楚,因此有必要把这些概念从根本上弄清楚。 首先看一下我们生活中的用户画像

基于大数据的校园就业用户画像的构建与应用

2019年9月10日第3卷第17期 现代信息科技 Modern Information Technology Sep.2019 Vol.3 No.17 1102019.9 基于大数据的校园就业用户画像的构建与应用 刘艳 (湖南科技职业学院软件学院,湖南 长沙 410118) 摘 要:随着时代的发展和进步,大数据理念已经逐渐为人们所熟知,并无时无刻不在影响着人们的生活和工作。通过利用大数据能够有效促进校园管理和建设的开展,能够对校园就业情况进行用户画像建设,一方面实现校园就业用户的更好管理,另一方面也能够促进校园就业工作的更好开展。 关键词:大数据;校园就业;用户画像;数据收集中图分类号:TP311.13;TP391.1 文献标识码:A 文章编号:2096-4706(2019)17-0110-03 Construction and Application of Campus Employment User Portrait Based on Big Data LIU Yan (Software College of Hunan Vocational College of Science and Technology ,Changsha 410118,China ) Abstract :With the development and progress of the times ,the concept of big data has gradually become known to people ,and has always been affecting people ’s lives and work. The use of big data can effectively promote the development of campus management and construction ,and can build user portraits of campus employment. On the one hand ,it can achieve better management of campus employment users ,on the other hand ,it can also promote better development of campus employment work. Keywords :big data ;campus employment ;user portrait ;data collection 收稿日期:2019-07-08 0 引 言 伴随着大数据时代的到来,社交网络与互联网的应用范围处于持续扩大之中。在整个互联网中,社交发挥着重要的基础作用。对于各个重大网站而言,其重要课题之一就是采集用户数据,并对其开展科学推荐工作。在开展个性化推荐工作的过程中,其包括许多步骤,用户画像提取过程发挥着关键作用。 1 画像的定义和用途 1.1 画像的定义 画像与profile 为同一概念,均是通过不同的维度,来对一个人进行描述,这些维度可以是事实的,亦可以是抽象的;可以是性别、年龄等自然属性,亦可以为职业、社交特征等社会属性;可以为是否高收入人群、是否有固定资产等财富情况,亦可以为是否已婚、是否有子女等家庭情况;可以是喜欢网购、喜欢逛商场等购物习惯,亦可以是位于在城市生活等位置特征;也可以是其他行为习惯。总而言之,在画像的范围中,将各个大家能够想象到的表达一个人特征的都包括进来,实际上,画像就是利用各种方法,通过数据来对人的特征进行描述。 1.2 画像的用途 (1)能够精确开展相关营销工作,对产品潜在用户进行科学分析。通过短信邮件等形式,针对特定群体,开展相 关营销工作。 (2)针对对用户进行相关统计,例如:全国就业高等院校有哪些、中国大学购买书籍人数TOP10等。 (3)进一步挖掘相关数据,建设智能推荐系统,通过关联规则,开展相关计算工作,比如,就业岗位更喜欢什么样的学生。通过聚类算法,开展相关分析工作,了解就业学生的特点以及行业分布状况等。 (4)开展效果评估工作,健全产品运营情况,以此来实现服务质量的提升。换而言之,就是开展市场与用户调研活动,在短时间内对服务群体做出定位,并提供具备较高水平的服务, (5)针对特殊用户开展私人定制工作,换而言之,对某类群体,甚至每位用户提供个性化服务。 (6)可以科学分析业务经营情况,亦可以合理分析竞争情况,上述分析结果会对企业发展战略的制定与实施,造成一定的影响。 2 大数据的校园就业用户画像的构建和应用 2.1 数据收集 通常情况下,在数据收集方面,可以分为四种类型,即:基本用户数据、就业行为数据、就业行业数据以及未来发展数据。 (1)基本用户数据。其主要内容包括就业学生的姓名、性别、年龄、年级、学习的专业等。 (2)就业行为数据。其主要包含:就业中的表现、就业的情绪、就业过程中的经历、面试的单位、参与面试的心

如何构建用户画像

作为一名SEMer或信息流优化师,了解用户并满足用户需求是必须要具备的技能。但由于每个人都受限于自己对于事物的认知,可能会导致对同一件事情的理解出现偏差。尤其是当我们把自己对产品的理解拿来当做用户对产品的理解来定义需求时,就容易出现所谓的“弹性用户”。每个人都说是为了用户体验着想,但这样定义出来的用户显然不是产品真实的用户。所以用户画像这个工具就出现了,它是一些真实用户构建出来的原型,用来帮助产品设计人员有针对性的制订产品功能,服务策略,销售策略,从根本上来讲,用户画像就是网络营销人了解用户所使用的。 问题来了:我们构建出来的用户画像,真的能够帮助到我们吗? 在用户画像中,我们得知用户的年龄、性别、学历、婚姻状况等基本信息和工作信息,还有用户的一些特点和目标,是不是感觉已经很完善了? 现在这个用户处于无房无车的状态。假设我现在是一个卖车的商家,我应该给她推荐什么样的车? 也许你会说,她比较文艺,那么应该给她推荐带有文艺气息的车。 也许你会说,她注重享受,那么应该给她推荐配置豪华的车。 也许你还会说,她没车的同时也没房,那可以给她推荐个房车,同时解决了房和车的问题。

于是在有用户画像的情况下,“弹性用户”依然出现了,那么问题到底出在哪呢,这个用户画像为什么不能帮助我们作出正确的决策呢? 人口结构≠用户画像 用户画像最早是由Alan Cooper在提出的,在经典的著作《About Face》中有专门的一个章节是讲用户画像,他在书中提到用户画像的核心是观察用户,把观察到的行为的一些独特的方面列出来,形成一个行为变量集。 虽然说人口变量(比如年龄、性别、学历、地理位置)等等因素对于行为也有一定的影响,但是这种影响并不能构成用户与用户之间差异化的核心。真正形成差异化核心的是用户的行为,更深入的来说,是用户行为背后的动机。 所以这就是为什么上面那个用户画像没办法帮助我们做一个卖车的策略,因为它并没有告诉我们当用户买车的时候,主要考量的因素是什么,是价格,品牌,还是其他的因素。 常见的用户画像错误还有描述用户生活中的一天,因为通过观察用户一天的行为只能观察到他做了什么事情,而不能观察到他做这件事情的动机是什么,尤其是对于买车这样决策周期很长的事情来说,观察用户某一天的生活其实意义并不大。 这里我们就要讲解一个概念,叫考量度。 什么是考量度呢? 它是指用户在做一个决策之前,所需要思考的程度,从思考的多少可以分为高、中、低三个考量度等级。

新浪微博的用户画像是怎样构建的

新浪微博的用户画像是怎样构建的? 1.概述 从上一篇《认识每一个“你”:微博中的用户模型》里面对用户模型维度的划分可以看出,属性和兴趣维度的用户模型都可以归入用户画像(User Profile)的范畴。而所谓用户画像,简单来说就是对用户的信息进行标签化。如图1所示。一方面,标签化是对用户信息进行结构化,方便计算机的识别和处理;另一方面,标签本身也具有准确性和非二义性,也有利于人工的整理、分析和统计。 用户属性指相对静态和稳定的人口属性,例如:性别、年龄区间、地域、受教育程度、学校、公司……这些信息的收集和建立主要依靠产品本身的引导、调

查、第三方提供等。微博本身就有比较完整的用户注册引导、用户信息完善任务、认证用户审核、以及大量的合作对象等,在收集和清洗用户属性的过程中,需要注意的主要是标签的规范化以及不同来源信息的交叉验证。 用户兴趣则是更加动态和易变化的特征,首先兴趣受到人群、环境、热点事件、行业……等方面的影响,一旦这些因素发生变化,用户的兴趣容易产生迁移;其次,用户的行为(特指在互联网上的行为)多样且碎片化,不同行为反映出来的兴趣差异较大。接下来主要介绍一下微博画像中兴趣维度的构建方法。 2.微博用户兴趣分析 1标签来源 用户自标签、达人或认证标签、公司、学校、微群标签、星座、微博关键词……这些来源都可能成为用户的标签。而针对每个特定的用户收集标签除了其自身以外,他关注用户的标签也会传递到该用户身上。如图2所示(蓝色实线代表关注关系,橙色虚线代表兴趣标签来源)。 2权重计算

在收集到一个用户可能存在的标签后,还需要给标签赋一定的权重,用来区分不同标签对于该用户的重要程度。不同标签的来源用户质量,标签的传递路径,转发关系,标签的本身,以及标签与用户之间的共现关系都会考虑在内。 不同质量的用户自身产生的标签权重不一样,质量越高,认为该标签的可信度越高,无论是将该标签赋给自己还是传递出去的时候其权重值越高。 标签的传递路径主要是针对基于关注关系的标签传递,亲密度比较高的关注用户传递过来的标签权重值会比较高。 标签是来自于用户的原创还是其转发的微博,权重值会有区别,一般来说原创的权重会高于转发权重。 如果标签本身是一个非常常见的词,那么它用于刻画用户的兴趣的区分性是比较差的,相反如果是一个长尾词,则区分性较强。出于这样的考虑,越是长尾词,标签的权重值会越高。 标签与用户的共现关系是指用户和该标签是否经常共同出现,评价的是两者的关联性。关联性越高,则标签的权重值越高。 综合上述的因素,一个标签对于特定用户的权重值可以大致表示为:标签权重= (来源因子 + 亲密度因子 + 转发因子 + 长尾因子) × 共现因子。 3时效性 随着时间的变化,用户的兴趣会发生转移,时间越久远,标签的权重应该相应的下降,距离当前时间越近的兴趣标签应该得到适当突出。出于这样的考虑,一般会在标签权重值上叠加一个时间衰减函数,这个时间衰减函数被设计成如图3所示的指数衰减的形式,通过定义衰减幅度和半衰期,调节衰减的程度,体现不同的时效性。 此外,针对用户的兴趣,还会设定一个较小的时间窗口来获取用户的短期兴趣。通过用户在短时间内的原创、转发和关注行为收集兴趣标签,并计算标签

用户运营知识结构归纳之用户画像(精编文档).doc

【最新整理,下载后即可编辑】 用户运营知识结构归纳之用户画像 智能手机新增流量消失、红利过去、超级用户思维、智能手机市场国内饱和…… 这是我们从2016年起至今,在各类互联网大咖以及媒介平台看到最多的关键词了。 因此,用户运营开始有了地位,如何盘活现有的用户群体是每一个(移动)互联网公司老板们考虑的问题。 2018年始,在给自己做工作规划的时候,定下了运营知识深度学习的两个方向:用户运营、数据分析。 做运营这些年,也看了不少用户运营的文章和书籍,每个大咖写的都特别好,但是都不够系统,所以想着自己可以梳理下用户相关的知识结构。 终于拖延了四分之一2018年之后的近1个月时间,把沉淀在Evernote的大咖文章做了梳理和归纳,分享给大家,仅供参考。 文章主要从三个方向来梳理用户运营的知识结构:用户画像、用户生命周期、用户成长激励。 内容穿插会给到每个环节需要的准备工作、监测数据等,篇幅较长,分三次发布,看官要有耐心~

误区:Persona(用户角色)VS Profile(用户画像)Persona用户角色 描绘抽象一个自然人的属性 通过调研问卷、电话访谈等手段获得用户的定性特征——用户间有差异,因为存在差异,所以需要描述 是用户属性的集合,不是具体谁,放一张某某的照片也是为了达到共情。它应该能准确描述出产品用户,一般会设置三到四个用户角色,也是通常意义上的目标用户群体 用户角色有缺点,评估用户属性时难以量化,也很难证伪。你不知道它确定的是不是真的目标群体,用户群体也随时间推移变化,所以用户角色需要不断修改。 Profile用户画像 和数据挖掘、大数据息息相关的应用,被更多运营和数据分析师使用,是各类描述用户数据的变量集合 通过数据建立描绘用户的标签 基于用户画像的应用:个性化推荐、广告系统、活动营销、内容推荐、兴趣偏好 当我们想要选择某部分用户群体做精细化运营时,会用用户画像筛选出特定的群体

用户画像构建研究

2019年3月25日第3卷第6期 现代信息科技 Modern Information Technology Mar.2019 Vol.3 No.6 17 2019.3 用户画像构建研究 马朋辉,王雪宁,李勇,邵帅 (吉林大学,吉林 长春 130012) 摘 要:本文主要研究了基于搜狗引擎用户浏览数据下的用户画像构建,我们具体地、标签化地、有针对性地描述了用户特征,并以此作为市场分析、商业决策、精准营销的依据。用户画像技术可以帮助搜索引擎更有针对性的服务用户。本文主要工作:一是对用户搜索数据集进行预处理,分词上我们选用了Jieba 分词工具;二是特征词的选取采用了基于TF-IDF 的向量空间模型;三是使用Word2vec 将特征词转变为词向量;最后使用不同的分类器构建用户画像,我们在这里使用了Stacking 模型。 关键词:用户画像;Word2vec ;词向量;Stacking 中图分类号:TP391.1;TP391.4 文献标识码:A 文章编号:2096-4706(2019)06-0017-03 Research on User Portrait Construction MA Penghui ,WANG Xuening ,LI Yong ,SHAO Shuai (Jilin University ,Changchun 130012,China ) Abstract :This paper mainly studies user portrait construction based on user browsing data of Sogou engine. We describe user characteristics concretely ,labeled and targeted ,and use this as the basis of market analysis ,business decision-making and precise marketing. User portrait technology can help search engines more targeted service users. The main work of this paper is as follows :Firstly ,the data set of user search is preprocessed. In word segmentation ,we choose Jieba word segmentation tool ;secondly ,we use TF-IDF-based vector space model to select feature words ;thirdly ,we use Word 2vec to transform feature words into word vectors ;finally ,we use different classifiers to construct user portraits ,we use Stacking model here. Keywords :user portrait ;Word 2vec ;word vector ;Stacking 收稿日期:2019-03-15 0 引 言 大数据时代的到来,有力的缓解了信息爆炸的问题,搜索推荐系统也一直在致力于从“拉”模式到“推”模式的改变[1],与此同时,随着互联网计算机技术的快速发展,云计算技术的出现为大数据的及时性分析、处理提供了技术上的支持[2],用户画像是根据用户的社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”。通过构建搜索引擎的用户画像可以大大减少平台的运营成本。 1 相关技术介绍 Word2vec :Word2vec 模型其实就是简单化的神经网络,一般分为CBOW (Continuous Bag-of-Words )与Skip-Gram 两种模型。CBOW 模型的训练输入是与某一个特征词的上下文相关的词相对应的词向量,而输出的就是这特定的一个词的词向量。Skip-Gram 模型和CBOW 的思路是反着来的,即输入是特定的一个词的词向量,而输出是特定词对应的上下文词向量。CBOW 对小型数据库比较合适,而Skip-Gram 在大型语料中表现更好。 Stacking 模型:Stacking 是一种分层模型集成框架。以两层为例,第一层由多个基学习器组成,其输入为原始训 练集,第二层的模型则是以第一层基学习器的输出作为训练集进行再训练,从而得到完整的Stacking 模型。 2 用户画像模型构建 2.1 数据集 本文中所采用的数据来源于CCF 竞赛平台,搜狗公司提供的用户搜索数据,其中用户的ID 经过加密算法加密。 其中每条数据包含用户的ID 、Age (年龄)、Gender (性别)、Education (教育程度)、Query List (用户搜索词列表)。数据说明如表1。 表1 数据属性说明表 属性 性别年龄学历分类 0:未知性别0:未知年龄0:未知学历1:男性1:0-18岁1:博士2:女性 2:19-23岁2:硕士3:24-30岁3:本科4:31-40岁4:高中5:41-50岁5:初中6:51岁以上 6:小学 2.2 预处理 数据的预处理包括数据清洗、自定义词典、分词处理。在数据清洗过程中,我们主要对空值进行了处理,为了提高

构建用户画像的数据分析流程

构建用户画像的数据分析流程 第一部分用户画像是什么 用户画像在网络上广泛被定义为“根据用户社会属性、生活习惯和消费行为等信息而抽象出的一个标签化的用户模型。” 总结来说,用户画像的核心是为用户打标签。也就是将用户的每个具体信息抽象成标签,然后利用这些标签将用户具象化,从而为用户提供个性化服务。最终的导向还是提取用户共性的信息,并提供战略决策。 第二部分用户画像分析的价值 用户行为给企业的产品和服务带来了一系列的改变和重塑,其中最大的变化就是用户行为在企业面前是“可追溯”、“可分析”的。企业内保存了大量的原始数据和业务数据,这是企业经营活动的真实记录,随着大数据技术的深入研究与应用,企业的关注点日益聚焦在如何利用大数据来为精细化运营和精准营销服务,而要做精细化运营,首先要建立企业的用户画像,对其进行分析,赋能产品、提升公司的业务决策。 第三部分如何分析用户画像 在企业搭建起“用户画像体系”后,我们该如何围绕用户画像的数据进行分析和布局呢,如何利用用户画像赋能产品、提升公司的业务决策呢? 值得注意的是,业务处在不同阶段,其侧重点也不同,在构建用户画像之前应依照业务现状排列需求优先级。并且用户画像并非一成不变,市场不断变化,客户的需求以及兴趣点也在变化,业务需要跟进客户的变化不断调整用户画像的策略。 分析流程如下: 1、目标解读 在建立用户画像前,首先需要明确用户画像服务于社群的对象,再根据实际需求,明确未来社群的建设目标和用户画像分析之后的预期效果。 例如:不同业务方对用户画像的需求有不同的侧重点,就运营人员来说,他们需要分析用户的特征、定位用户行为偏好,做商品或内容的个性化推送以提高点击转化率,所以画像的侧重点就落在了用户个人行为偏好上;就数据分析人员来说,他们需要分析用户行为特征,做好用户的流失预警工作,还可根据用户的消费偏好做更有针对性的精准营销。 2、明确分析维度/指标口径 我们已经明确了用户画像的服务对象与应用场景。那么,接下来需要针对服务对象的需求侧重点,结合现有业务体系和标签之间的关联关系,明确分析维度。 可以从用户属性分析和用户行为偏好等维度,具体如下: ?群友性别占比、男女职业差别 ?所在城市的分布 ?群友与数据分析的相关度 ?群友期待在XX获得什么 ?提供帮助和收获之间的关系

相关文档
最新文档