浅议在线在线社交网络中好友亲密度判定办法研究毕业设计365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐总结

365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐导读:型,主要是出于两个方面的原因考虑:首先,为了计算好友亲密度,由于效率和隐私问题,不可能包含所有的互动类型;此外,首选互动类型的选择也会体现在好友亲密度计算时所占的不同权重。  1.2?互动计数  使用互动计数可以将用户间交互多样性和复杂性简单化,是一种非常有效的方式,它表示一个用户和他的朋友间在一定时期内互动的总
  摘 要:与现实生活中的朋友关系不同,多数的在线社交网络系统为每个人只设定一个简单的二元好友联系,即要么是朋友,要么不是。这种好友关系的定义为个人隐私信息的保护带来了许多问题。分析了一种基于当前社交网络平台的互动信息自动判定好友亲密度方法,并结合该方法提出了一种半自动的隐私控制框架。

  关键词关键词:社交网络;好友亲密度;数据挖掘;隐私控制

  16727800(2013)008011304

  0 引言

  在线社交网络系统通常是基于个人和他们的社会网络关系共同构成,它不仅取决于单个节点,而且也包含了特定的节点所拥有的连接,这些连接通常包括内容、方向和强度等特征。这种关系的强度也被称为好友的亲密度,其特性表示了两个人或两个节点在社交网络中的亲密程度,例如关系好、关系一般和疏远。在现实生活中的社交网络,好友关系的亲密程度是每个人决定自己隐私界限的

  关键因素,这种主观的感觉非常有效地被人用于

源于:365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐的基本格式http://2s4f.com

决定自己的各种隐私信息可以告诉谁或被谁获取。

  另一方面,当前大多数的在线社交网络系统中,并没有表示出这种关系的亲密程度和它的环境因素,此外,每个人为了保持其在线友谊也遵循各自不同的方法,有些人坚持传统的友谊定义,有些人则将任何人作为其好友,很多人甚至不知道其设定的好友是谁。鉴于这种情况,在线社交网络系统出现了一种奇特的好友现象:有些人不信任或不熟悉其所谓的“朋友”,这使得在线社交网络更像一个“虚构的社区”。因此,除了来自陌生人的隐私安全威胁,每个人也可能面对来自其“好友”成员的隐私安全威胁。

  出现这种问题的根本原因在于大多数的社交网络系统体系结构没有考虑到好友的亲密程度和好友关系的类型(如老师、同学、亲属等),这使得用户不得不将其父母或亲属都列为好友的行列。近来,一些社交网络系统开始尝试提供一些功能使用户能够设定好友的亲密度来保护个人隐私,但是,随着时间的推移,好友的亲密程度也会随之发生变化,这就使得用户开始设定的好友亲密程度在经过一些时间后可能变得毫无意义,不得不重新设置。因此,找到一种能够自动判定好友亲密度的方法,对保护在线社交网络用户的个人隐私就显得尤为重要。

  1 判定好友亲密度因素

  当前大多数的在线社交网络系统提供了一些特征信息,可以用来预测每个人之间的亲密程度。通过对人人网、开心网等社交类网站的分析发现,在线社交网络系统通常都提供了很多种互动、分享和沟通形式。即包含实时交互,也包含非实时交互。通常这些因素可以分成两大类:基于互动的和基于非互动的,它们既能单独使用也可以组合起来一起使用,如图1所示。

  图1 在线社交网络互动类型

  这些在线社交网络环境下的互动信息可以用来评估和识别好友关系的紧密程度,如互动类型和用户所处的环境等。下面我们将进一步分析这些因素如何影响好友亲密度的计算。

  1.1 互动类型

  在线社交网络系统提供了众多的互动功能,为了计算好友亲密度,选择合适的互动类型非常重要。个人选择互动类型与信息资源、好友关系的亲疏程度和对应的听众有着密切关系。根据笔者在人人网、开心网对用户进行的调查显示,如果信息是一个秘密或者只与网络中的特定人有关,私信是首选的沟通方式;另一方面,如果互动信息希望被整个网络所关注,涂鸦墙通常会被优先考虑。因此,互动类型通常决定了亲密性、开放性、敏感性以及通信双方之间的关系强度。

  图2 首选互动类型统计

  图2的调查结果显示,受访者都选择私人消息,评论和聊天为首选的交互方式,与他们最可靠的朋友进行沟通。之所以要选择首选互动类型,主要是出于两个方面的原因考虑:首先,为了计算好友亲密度,由于效率和隐私问题,不可能包含所有的互动类型;此外,首选互动类型的选择也会体现在好友亲密度计算时所占的不同权重。

  1.2 互动计数

  使用互动计数可以将用户间交互多样性和复杂性简单化,是一种非常有效的方式,它表示一个用户和他的朋友间在一定时期内互动的总数。等式(1)说明了其具体的计算方式。其中:Tinteraction表示一个用户u与朋友v在特定时间t中使用互动类型I进行交互的总次数,w表示不同互动类型I在进行好友亲密度计算时的权重。

  当使用互动计数进行好友亲密度计算时,需要考虑一些因素的影响。首先,每个人同他们朋友的互动习惯不同,有些用户同他们关系密切的朋友频繁互动,而很少与关系疏远的朋友互动,反之亦然;其次,每个人所处的环境也是影响使用互动计数进行度量的一个重要因素。每个人不太喜欢同与他们生活或工作在同一环境下的好友频繁使用社交网络互动,如同在一间办公室或房间;最后,用户在社交网络中的活跃水平也影响他与其他人互动的行为。通常,社交网络中不活跃的成员与其朋友互动的次数很少,当然,这些人的朋友也很少使用在线社交网络联系他们。根据在人人网上的调查,70%的用户更喜欢经常与他们关系密切的好友进行互动,而且越活跃的用户同他们好友的互动次数越频繁,85%的用户至少一周同他们关系密切的朋友活动一次。

  1.3 共同的朋友

  除了前面提到的互动计数为基础的度量指标,个人之间的共同朋友也是一个可以用于好友亲密度计算的因素。共同的朋友是指社交网络中两个人之间的共同的朋友总数。拥有共同的朋友通常代表了这样的事实:个人之间彼此连接非常紧密,或者他们可能具有相同的环境。这些信息可以被单独用作好友亲密度计算度量或结合其它一些度量标准进行计算。

  公式(2)中的T共同朋友表示了用户u的朋友列表和用户v朋友列表之间的交。我们可以使用这个信息来简单计算该项指标在决策判断时的贡献率。

  2 判定好友亲密度方法

  数据挖掘技术是一门交叉学科,汇集了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域,是通过分析现有数据库中的数据来解决问题的技术。数据挖掘技术是一种机器学习的方法,其使用训练数据集来建立一个模型,并利用这个模型来解决现实生活中的问题。数据挖掘是一个整体过程,而不是一个单一的算法,通常包括几个阶段,一般情况下,通过数据挖掘技术计算好友亲密度的过程如图3所示,其包括离线和在线两种模式。

  图3 使用数据挖掘技术计算好友亲密度的过程

  在离线模式下,训练数据领域选择、训练数据集准备、模式发现和评估,这些过程被称为数据挖掘模型创建或训练阶段。然后,这个经过验证的模型再与某些特定的在线网络社交平台结合,即可实现联机模式下的计算用户的好友亲密度。因此,离线模式下数据挖掘模型的质量直接决定了在线应用时的准确性。

  离线模式下,首要任务是选择合适的数据领域或属性来用于数据挖掘模型的训练数据集。这些数据领域大多是基于互动,如互动类型和互动环境等。此外,其他的数据领域,如用户目前状态、活动水平、个人信息的访问,这些既可以单独考虑,也可以和基于交互的数据领域信息结合使用,这是数据挖掘的一个重要阶段,应认真仔细进行。

  当数据领域确定后,数据挖掘过程进入训练数据集准备阶段。在这个阶段,选定属性的实例数据既可以是原有系统的历史数据,亦可以是人工重新收集的。训练数据准备是数据挖掘过程中最为关键的阶段,因为数据挖掘模型的性能和精度完全取决于其训练数据。

  我们可以使用表1中假定的数据来进一步示范说明属性的选
上一篇: 分析文本基于文本信息的聚类办法研究毕业365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐结论 下一篇: 没有了
穗丰365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐网———写经典365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐经典的网站,找毕业365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐范文,365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐格式模板,365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐****就上穗丰365bet体育在线下载_365bet娱乐场注册_365bet提款多久到帐网!