用户画像
用户画像(英文:User portrait)是一套全面关于用户信息的标签,给公司提供决策(商业业务的分析)。用户画像是阿兰·库珀(Alan cooper)在1999年提出的,直到大数据时代的到来,用户画像开始逐渐在各方面领域应用,从根据用户本人的需求开发,转变为以搜集用户数据进行分析而进行开发。
用户画像的原理是,制定一套全面代替“人”的标签,进而代替用户,预测用户喜欢的内容。用户画像的标签类型分为统计类标签、规则类标签和机器学习挖掘标签3大类。
用户画像是利用大数据技术对不同类型的人群的进行分析,并为这些人提供出个性化服务,同时给企业带来商业价值。用户画像的应用产生的影响呈现两极分化。一方面用户画像应用于服务业、教育、公共服务和制造业供应链等等正面影响方面。另一方面有信息泄露、信息茧房等产生的负面影响。
起源
用户画像最早是美国人阿兰·库珀(Alan cooper)在1999年Inmates Are Running the Asylum, the Why High-Tech Products Drive Us Crazy and How to Restore the Sanity的初版提出的。他在应用用户画像时,将用户分为不同类型,并利用行为、性别和偏好等要素对用户进行描述,形成真实用户的虚拟代表,这种用户画像被称作“User Persona”。这是一种定性研究方法,能够直接将用户的核心诉求展现出来。
大数据(Big 数据)时代到来之前,大数据是指信息爆炸时代产生的海量数据。这开辟了新的市场,企业积累了大量的用户数据,企业以前的技术无法满足实现精准的用户需求的服务模式,用户画像为解决这种难题而被提出。用户画像的定义是一个演变的过程。但随着“大数据”时代的到来,开发一款软件,从根据用户本人的需求开发,转变为以搜集用户数据进行分析而进行开发,(定义为标签作为用户的特征标识,通过标签描述用户),这种用户画像称为 “User Profile”,这属于数据驱动的定量研究。“User 人格面具”和 “User Profile”虽然表述不一样,但基本内涵一样。随着大数据发展,统计方法在用户画像中的应用研究占有重要位置,逐渐在各方面领域应用。
标签类型
用户画像标签化既方便人理解,又方便计算机的处理。因搜集的数据同时也受时间、地点限性的影响,可以分为动态标签和静态标签。用户画像的数据根据应用实际,又可以分为一级标签和二级标签(如省包含市)。但一般情况下,用户画像的标签分为统计类标签、规则类标签和机器学习挖掘标签,其中前两类占开发应用的比例较大。用户画像的标签化初步制定后,再进行评估用户画像的标签的合理性,不合理的标签进行更改,合理的采用。
统计类标签
统计类标签是对用户画像的数据进行分类的统计标签,也是最基础、最常见的用户画像标签。如性别、年龄和地区等。地区类标签又可以包含二级标签。通过这些基础的用户画像标签,软件公司就可以统计,性别比例、年龄比例和地区分类等,为用户画像的建立做前期的准备。
规则类标签
规则类标签是根据用户画像的数据中用户的历史行为,结合特定的规则而确立的。例如在进行统计消费信息时,将一月内“消费次数\u003e2”,统计成“高次数消费人群”标签。
机器学习挖掘标签
机器学习挖掘标签,主要应用于用户画像的需求预测,开发难度大、周期长。如根据已有的用户画像数据,进行预测用户的喜好,又或者进行视频推荐,这就达到了建立用户画像的最终目的,即商业目的。
应用
用户画像是开发软件中的一项技术。用户画像的落地应用,公司要提前准备相关工作,然后应用用户画像技术等技术,最后进行后续工作。
应用场景
用户画像具体应用的方面除了上述以外,还可以应用在服务业如视频推荐,教育方面如预防恶性校园贷和人才培养等方面。也可以应用在公共服务和制造业供应链等等方面。
这里以视频推荐、预防恶性校园贷和人才培养举三个应用方面例子。视频推荐:带来用户满意度高的推荐。以抖音为例,抖音用户的黏性高,以“娱乐消遣”为主要的内容,生活类、搞笑类视频更受欢迎,对视频也更为接受。预防恶性校园贷:如脱离父母管控,没有能力还款的大学生,容易在不合法平台,开始贷款。这项技术可以,警示学校关注重点人群,做到事前把控。人才培养:可以为图书馆一直全新的服务,扩宽思路,为学校人才培养提供服务。
用户画像开发及涉及技术流程,以抖音APP建立为例,首先建立数据库用来储存信息。其次搜集信息,抖音首先关注用户历史浏览偏好、使用环境,以及年龄、职业、性别等人口统计学特征。关注用户的行为反馈,如点击、观看、收藏、评论。再进行上传,以达到搜集数据。然后进行用户画像的数据分析,首先要进行删除无关的数据(降维),然后制定标签,拿抖音用来“消遣”的动机占比高达93.68%,其次是“社交”和“学习”,再进行细分,“生活类”“搞笑类”视频更加受欢迎,这些标签用来分类,并把这些数据进行储存,然后根据新发布的视频按标签分类,推荐给不同用户画像类型相同的人们,这些数据同样也要搜集,抖音再拿这些数据进行分析,并进行算法的优化,这些分析报告抖音也会发布出来,如抖音生活服务2022酒旅专题报告,从用户对抖音的用户画像算法推荐的视频接受度较高,这也造成了导致用户沉溺。
开发与技术
准备
用户画像是在搜集软件公司搜集完用户数据,对用户进行分析的一项技术。在进行用户画像分析前,公司要做些准备工作,首先需要建立服务平台,给用户提供服务,同时进行管理(搜集、存储)数据。其次,公司需要简单统计数据,以及可视化操作。然后公司进行用户画像的数据分析。
涉及技术
公司开始利用用户画像、用户行为分析等技术,为进行个性化的推荐做准备。
搜集和存储
用户画像的数据的搜集技术包括爬行纲技术,这是为用户画像提供原始素材。搜集的数据同时也受时间、地点限制的影响,因此需要建立动态的搜集数据。用户画像的数据需要用数据库储存。
数据分析
用户画像的数据分析类技术包括降维、标签制定和判定、分类、数据架构建立和知识的推理(预测)。降维,指处理用户画像数据之前,还需要删除无用的信息,如一些语气词“的、了”。标签制定和判定,用户画像建模其实就是对用户“打标签”,例如根据不同的标签的重要性,进行数学计算,如喜欢“喜剧电影“的人多,就把“喜剧电影”单独作为一个标签。
分类被认为是数据分析的最基本形式之一,例如把喜欢相同内容的人归类。数据架构建立包括进行分类储存、调度数据,如把喜欢喜剧的人的数据,创建命名“喜剧”的数据库里,也方便以后的“拿取”。知识的推理(预测喜欢什么),可根据已知的用户画像数据,推荐给用户可能喜欢的内容,如一部“喜剧”的电影,可以推荐给用户画像标签为“喜欢喜剧”的人们。
可视化
用户画像的数据体现包括可视化技术。可视化可以帮助人们做决策,可以体现某一部分变量和指标对人们有用。主要有基本图(条形图、折线图和散点图)、分布图(箱形图和直方图),还有交互式可视化图像,以及具有特殊结构(分层、网络和地理)的数据的专用图,如应用于商业业务的分析,视频平台公司可以制作词云来表达用户对高分电影的偏好,如图例。
此外可视化还应用于政务数据、无人服务台、监督和智慧校园等方面。
开发
在进行完用户画像分析后,公司进行后续工作,公司管理层进行决策,选出运行策略。然后开发软件,公司首先确定服务的人群。其次把任务分解给不同部门,并进行市场调研。然后,公司内部人员讨论问题并确定需求。最后,公司进行开发测试软件。
影响
正面影响
服务产业
用户画像可以帮助公司更好地掌握用户偏好,优化产品,制定运营策略,为用户提供更有针对性的服务。例如算法推荐机制,可以在海量数据中实现内容精准分发,也扩大了用户以低成本接触信息的范围,公司也实现个性化服务,同时通过发布广告来进行营收,这便提高了公司的生存能力、竞争力和营收能力等等。
教育
除了上述方面,还包括基于用户画像技术设计的知识图谱,更加全面反映人对知识掌握情况,这种数据结构也便于被机器理解。知识图谱提供了一种组织、 管理和理解海量用户信息的方法,进一步完善用户画像体系,这也降低了更新迭代成本。这便可以帮助人们更好的掌握知识,去进行个性化学习。
公共服务
通信
用户画像可以帮助基站的建设,提供更好的通信服务质量。如,先收集拨打时间、基站坐标和网络请求时间等等,然后建立不同的位置的通信用户画像,这些数据也可以推测出用户的工作方式、 住家地点、工作地点、生活规律、出行方式等等方面,提供更好的通信服务。
水、电、气
通过用户画像技术建立智慧水务平台、电力调度平台和燃气决策平台。这也是通过先收集不同地区,不同用户的使用数据,然后建立不同地区、不同用户的大小标签,进行资源调度,满足人们的资源需求。
防诈骗
用户画像应用于防诈骗,根据搜集到的被诈骗对象进行标签制定,制定出的统计类标签“性别、年龄比例”,根据统计,标签为“男性、青年”被诈骗的多,进一步根据搜集到的数据,预测可能被诈骗的人群的用户画像,进行防诈骗预警。
负面影响
信息茧房
软件公司在设计推荐系统时,利用用户画像技术,为用户提供精准的服务,加之用户对这些服务有需求,用户于是便将自己禁在这样的“信息茧房”。
2006年,凯斯·桑斯坦教授的《信息乌托邦》提出,指让人感兴趣的信息如“蚕丝”,人们把自己用“蚕丝”包裹起来,用户沉迷其中,并以此产生的相关技术。相关理论有“回声室效应”和“过滤气泡”。回声室效应,不仅包含信息茧房,还涉及公众媒体发布的同质化信息,影响了公众对于事件信息的准确的认知与判断。过滤气泡,是在信息茧房和回声室效应的结合升级形态,同时包含群体极化效应,即群体观点便是“主流观点”。
使用用户画像等技术设计的推荐系统,青少年在这些被设计的系统内,容易被其内容吸引,耗费了不少时间、精力,在这一过程中,青少年易与家人产生纠纷。
信息泄露
因为用户画像的应用首先需要搜集个人信息。而用户画像的建立过程中,都有个人隐私的保护问题。2021年11月1日《中华人民共和国个人信息保护法》正式施行。保护信息不被泄露,这需要人们的共同遵守。相关的事件有脸书数据门、学生信息泄露和消费者信息泄露等。
相关事件
脸书(facebook)数据门
2018年3月,脸书“数据门”事件被爆出来并引出反响,Facebook收集了5000万用户的个人用户信息记录,并卖出这些信息。2016年,脸书为了帮助唐纳德·特朗普竞选总统,用脸书搜集信息,分析众多的美国选民的心理特征和个人爱好,进而帮助其竞选总统。美国、英国和欧洲的议员们要求展开调查,由此,脸书公司陷入“数据门”,受到了多起官司,脸书被罚款50万英镑,但用户使用该平台的频率并未减少。
短信推销
某些应用程序强制收取用户信息,并进行用户画像分析,向用户发送营销短信。这类软件强制要求输入“职业”“学习目的”等项,才能登录页面。用户向法院起诉这类APP,说这一行为属于强制收集用户画像信息,法院查明,该应用程序确实有这类行为,遂判处软件运营商删除个人信息并停止该行为,并向用户赔礼道歉并赔偿维权所产生的费用。
参考资料
教育是信息茧房的解药.今日头条.2023-02-05
信息茧房如何“破防”.今日头条.2023-02-05
德国拟勒令脸书停止收集部分用户数据.今日头条.2023-02-05
算数报告 洞察报告 - 逆势创新 多元生长——抖音生活服务2022酒旅专题报告.巨量算数.2023-02-16
政务数据可视化.今日头条.2023-02-05
走进可视化无人服务厅.今日头条.2023-02-05
监督可视化 预警促落实.今日头条.2023-02-05
智慧校园的数据可视化.今日头条.2023-02-05
警惕陷入“信息茧房”.今日头条.2023-02-05
学生信息泄露何时休.今日头条.2023-02-05
消费者信息泄露问题堪忧.今日头条.2023-02-05
脸书数据泄露敲警钟 网络时代警惕数据滥用-中国科技网 .中国科技网.2023-02-05
脸书深陷“数据门”扎克伯格首度回应.今日头条.2023-02-05
脸书再陷隐私连环“官司门”.今日头条.2023-02-05
“数据门”后脸书使用量未减 部分人使用频率增加.今日头条.2023-02-05
软件运营商强制收集用户画像被判侵权.今日头条.2023-02-05