数据挖掘中的集群解析

数据挖掘中的集群解析

文章图片
【数据挖掘中的集群解析】社交媒体是重要的信息资源和完善的交流平台。企业和个人可以充分利用它, 而不仅仅是在平台上共享他们的照片和视频。该平台使用户可以自由, 轻松地与目标群体建立联系。无论是团体还是老牌企业, 都难以与竞争激烈的社交媒体行业站起来。但是, 通过社交媒体平台, 用户可以与他人一起营销或开发他/她的品牌或内容。
社交媒体挖掘包括社交媒体平台, 社交网络分析和数据挖掘, 以为学习者, 专业人员, 科学家和项目经理提供一个方便且一致的平台, 以了解社交媒体挖掘的基础知识和潜力。它提出了社交媒体数据引起的各种问题, 并提出了基本概念, 新出现的问题以及用于数据挖掘和网络分析的有效算法。它包括多种难度, 可以提高知识水平, 并有助于在不同的社交媒体挖掘情况下应用思想, 原理和技术。
根据《全球数字报告》, 2019年全球社交媒体平台上的活跃用户总数为24.1亿, 并且同比增长高达9%。通过互联网普遍使用社交媒体平台, 可以访问大量数据。社交媒体平台包括许多研究领域, 例如社会学, 商业, 心理学, 娱乐, 政治, 新闻和社会的其他文化方面。将数据挖掘应用于社交媒体可以提供有关人类行为和人类互动的令人兴奋的观点。数据挖掘可以与社交媒体结合使用, 以了解用户对主题的看法, 在人群中识别出一群人, 研究一段时间内的群体变化, 寻找有影响力的人, 甚至向某人推荐产品或活动个人。
数据挖掘中的集群解析

文章图片
例如, 2008年总统大选标志着美国社交媒体平台的空前使用。社交媒体平台(包括Facebook和YouTube)在筹集资金和将候选人的信息传达给选民方面发挥了至关重要的作用。研究人员提取的博客数据证明了候选人使用的社交媒体平台数量与2008年总统大选获胜者之间的相关性。
这个有效的例子强调了数据挖掘社交媒体数据在国家一级预测结果的潜力。数据挖掘社交媒体还可以产生个人和公司利益。
社交媒体挖掘是指社交计算。社交计算被定义为“将软件用作社交关系的中介或中心的任何计算应用程序”。社会计算涉及用于人际交流的应用程序以及与“计算社会研究”或“社会行为”有关的应用程序和研究活动。”
社交媒体平台是指被放置在以下子类别中的许多人共同使用的各种信息服务。
类别 例子
Blogs Blogger, LiveJournal, WordPress
社会新闻 迪格, 莎拉多
Social bookmarking 美味, StumbleUpon
社交网络平台 Facebook, LinkedIn, Myspace, Orkut
Microblogs Twitter, GoogleBuzz
Opinion mining 野狼, Yelp
照片和视频共享 YouTube的Flickr
Wikis Scholarpedia, Wikihow, Wikipedia, 事件
对于流行的传统媒体(例如广播, 报纸和电视), 通信完全是从媒体来源或广告商到广大媒体消费者的一种单向方式。 Web 2.0技术和现代社交媒体平台已经改变了局面, 从由媒体提供商驱动的单向媒体通信向几乎任何人都可以向大众发布书面, 音频, 视频或图像内容的方向转变。
这种媒体环境正在极大地改变与客户的业务沟通方式。它为个人提供了非常空前的机会, 使他们能够以非常低的成本与众多人民互动。在线呈现并通过社交媒体平台显示的关系是社交媒体平台的数字化数据集。由此产生的数据为链接到相似领域的众多应用程序提供了丰富的社会学机会, 以及对消费者行为和市场营销的见解。
社交媒体平台上的用户增长和数量令人难以置信。例如, 考虑最诱人的社交媒体网站Facebook。在运营的头六年中, Facebook的活跃用户超过了4亿, 并且呈指数级增长。给出的数字说明了头六年Facebook的指数增长。根据该报告, 根据用户每天在网站上的访问量, Facebook在网站上排名世界第二。
数据挖掘中的集群解析

文章图片
社交媒体平台的广泛使用不仅限于世界一个地理区域。 Orkut是Google运营的一种流行的社交网络平台, 拥有来自美国以外的大多数用户, 并且互联网用户中使用社交媒体已成为全球许多地区的主流, 包括Aisa, 非洲, 欧洲, 南美以及中东。社交媒体还推动公司和业务需求的重大变化, 以决定其政策以与这种新媒体保持同步。
社交媒体中数据挖掘的动机 通过社交媒体平台访问的数据可以使我们深入了解以前在规模和范围上都不可行的社交网络和社会。这种数字媒体可以改变现实世界的局限性, 以研究人际关系, 并有助于在不进行专门研究的情况下, 衡量流行的社会和政治信仰对区域社区的影响。社交媒体有效地记录了病毒式营销趋势, 是更好地了解和利用影响机制的理想来源。但是, 由于特定的挑战, 如果不实施数据挖掘技术, 则很难从社交网站数据中获取有价值的信息。
数据挖掘技术可以有效地帮助应对社交媒体数据的三个主要挑战。首先, 社交媒体数据集很大。以拥有24.1亿活跃用户的最受欢迎的社交媒体平台Facebook为例。没有自动化的数据处理来分析社交媒体, 社交媒体数据分析将无法在任何合理的时间范围内访问。
其次, 社交媒体网站的数据集可能很嘈杂。例如, 垃圾博客在博客圈中的数量很大, 在Twitter上的推文也不重要。
第三, 来自在线社交媒体平台的数据是动态的, 在短时间内进行定期修改和更新并不常见, 但这也是处理社交媒体数据时要考虑的重要方面。
将数据挖掘方法应用于海量数据集可以改善日常搜索引擎的搜索结果, 实现针对企业的特定目标市场营销, 帮助心理学家研究行为, 个性化消费者网络服务, 为社会学家提供对社会结构的新见解, 并帮助识别和预防对我们所有人都是垃圾邮件。
此外, 对数据的开放访问为研究人员提高了效率并优化了数据挖掘技术提供了前所未有的数据量。数据挖掘的进度基于巨大的数据集。社交媒体是数据挖掘边缘上的最佳数据源, 可用于为学术和相关数据挖掘分析师改进和测试新的数据挖掘技术。

    推荐阅读