网络电话通话记录_通话查询记录_网络语音通话

                   
专业调查机构联系电话,18610181714。代您查询删除各类记录资料,请来电咨询。

IANDAIHUA 2008)0620036203 基于电信通话记录的数据挖掘 (江汉大学物理与信息工程学院,湖北 武汉 430056) 摘要 :电信的通话记录中包括这些的呼叫数据 ,如果可从这种长期数据中抽取出有用的信息 ,可以辅助企业的经营决策 本文以电信的通话记录作为数据挖掘对象网络电话通话记录,在进行数据预处理的基础上 ,将与每个移动电话号码通话的对方电话号码组 一个集合,采用模糊集的谓词关联度算法进行推导 ,找出带有强关联度的电话号码 此平台通过实际验证,效果良好。 关键词 :数据挖掘 模糊集中图分类号 TP311.13 文献标识码 Application Fuzzy2assoc ia tion Rule TelecomDa ta IUXia Inform ionEngineering, ianghanUniversity, uhan430056, China) Abstract: usefulinformat ion can extracted from elecomcall record, will ai management decision2making hispaper dat elecomcall record resented wit knowrelat ionship between custom ers, comprised phonenum bers comm unicat ing wit everymobile phone, semantic correlat ion algo rithm based fuzzyset findout elephoneswit strong relat ionship. Experim ent show validity.Key words: dat ining;call record; relat ionship; fuzzy set 目前,随着电信体制改革的推进 ,电信企业之间 的竞争也日趋激烈 。

谁可把握更多的信息 ,谁就拥有 更多的商机 。电信业是典型的数据密集产业 ,电信企 业保存有长期的相关用户信息和通话记录 。如果可 从这种数据中抽取出有用信息 ,用于建立企业服务和 辅助企业决策 ,则针对企业的运营和演进 ,是相当有 意义的 。而这些从海量数据库中挖掘出有用信息的 技术 ,就是数据挖掘。 本文以某电信局通信记录为数据挖掘对象 本数据为几个月的移动电话通话记录和个别未知移动电话 (以代号表示 )某月通话记录,希望通 过探讨移动客户的通话习惯跟通话特点 ,挖掘出不同 移动电话用户之间的关系 ,是否具备联系相近的社会 群体 ,是关系密切 、关系通常还是没有关系 ,甚至推测 出不同的手机电话号码是否为同一个用户所有 系统结构对于该电信局通话记录的数据挖掘 ,本文提出了 一个三层结构的数据挖掘系统 ,如图 所示。后台是 数据库系统 ,前台是用户界面 ,中间层是数据预处理 数据挖掘算法和用途解释模块。整个平台的推动流程如下 1)根据一定的挖掘目的在源数据中进行数据收稿日期 2007211223作者简介 ,江西星子人,江汉大学物理与信息工程学院讲师 ,博士 ,研究方向 :系统预测与集成 ,系统改进 :基于电信通话记录的数据挖掘37 选择 ,并装载 ,形成初步的数据库 2)通过数据清理、数据集成 、数据归约和数据 转换等数据预处理 ,使数据库中的数据更加干净 、简洁、汇总 ,为下一步的数据挖掘做好准备。

3)选择适合的挖掘算法,并推动 数据选择在电信局的通话记录中 ,包含下列字段 呼叫发生地 、本方移动电话号码 、呼叫类型 、主被叫类型 方电话号码、呼叫时间 、呼叫时长 、移动话费 、长途话 、用户信息。本文的目的是应找出不同移动电话号 码的电脑客户之间的关系 ,以及不同号码是否为同一 个用户所拥有 。两个用户的关系 ,可以借助与它们联 系的其他人得到体现 。如果双方联系的群体非常相 ,那表明这两个用户关系密切,当它们联系的群体 达到某些程度近似的之后 ,可觉得这两个用户实际上 是同一个人 。为了提升在长期数据中程序运行的效 ,在此选用通话记录中的本方移动电话号码跟我方电话号码两个字段。 4)各省、市或地区按照本区域的状况 ,推出本 地电信特色服务 针对以上各类情况,消除不一致数据 ,进行数据 统一 通过数据清理、数据集成 ,消除了噪声 ,统一了不 一致 ,但存在长期重复记录 ,且数据变得动荡无序 有规律。这时需要进行数据变换 ,将数据转化成合适 挖掘的方式 。本文通过聚集的方式 ,对数据汇总 移动电话号码/代号数据汇总表 ,属性比如 移动电话号码/代号 ,通话总数量 (每月该移动电话 通话的总次数 ,不同对方号码数量(每月与该移动 电话通话的不同对方号码个数 移动电话号码/代号的对方电话号码数据汇 总表 ,属性比如 :移动电话号码 /代号 ,对方电话号码 (每月与该移动电话通话的每个对方电话号码 话次数(每月该移动电话与每个对方电话号码通话 的数量 数据挖掘算法本文采用模糊集上的谓词关联度概念来进行移 动电话客户关系的判断 。

模糊集上的语境关联度概 在现实世界中,数据库极易受噪声数据 、空缺数 ij据和不一致性数据的困扰 ,这些数据可能会影响并且 表示集合 ij改变数据挖掘的结果 导致无效或出错的决策。此集合中的隶属度 。为了让 A的每位元素唯一地对应 ,数据挖掘是在长期数据上进行的,不相关或弱相 B的某个元素 ,共有 关的数据,往往会妨碍挖掘的强度 。因此在进行数据 挖掘之前 ,应使用数据预处理技术 ,提高数据挖掘模 B之间的谓词关联度定义式的品质 ,降低实际挖掘所需的时间 ,从而提升其后 挖掘过程的效率跟性能。本文采用的数据预处理方 法比如 :数据清理 、数据集成和数据变换 数据清理。在通话记录数据中 ,由于机器通信信号以及机器 记录时的故障 ,可能会出现空缺值 、不完整数据以及 噪声数据 ,如类似‘0 ’、‘00 ’、‘000 ’的电话号码 些数据在测试设备故障时可能会起至重要作用,但在 本平台中 ,这些数据会增加数据挖掘的强度 ,影响数 据挖掘的结果 ,所以删除这类数据。 数据集成。对于显示的电话号码 ,由于下述这些原因 ,将会 导致同一电话号码 ,形式多种多样。 1)网络运营商采取的IP 电话接入号不同 ,移动为17950, 17951。

2)移动用户国际漫游,与中国用户通话的国际 长话 如‘886’、‘0086 ’、‘00186 3)通话所在的区域不同。如长途电话相对本 市电话 ,固定电话前加区号 ,移动电话前加‘0’。 SR 2,这样才能受到相当适合的关联度值 ,更有利于实际的预测和非常。 SR2 A表示与移动电话通话的对方电话号码集合 B表示与未知移动电话通话的他人电话号码集合 ,在模糊集内无重复对方电话号码 ai表示与 移动电话通话的我方电话号码集合中单个的对方电 话号码 ,即集合 A的元素 bij表示与未知移动电话 pi表示不同的单个对方电话号 表示不同的单个对方电话号 码在集合 B中发生的频率 。如果模糊集 B中的元素相似(即两个集合中的 对方号码相 bij,则这两个元素的关联 1;否则SR ,是唯一的,只能相同甚至不同 ,不存在模糊概念。 将模糊集的谓词关联度计算应用于通话记录的数据挖掘 ,可以找出带有强关联度的移动电话号码 说明拥有移动电话号码的两名用户联系的社会群体非常一致 ,具有相同的社会关系 ,可能二人是同学或 朋友 。并且借助对带有强关联度的未知电话代号的 各类数据与移动电话号码的各种数据 (主要包含通 话的对方电话号码和数量 )进一步比较分析 ,发现当 相关度超过一定程度 )且在所有关联度中为最大时 ,可觉得未知移动电话代号与对应的相关移动 电话号码属同一用户所有 所示为平台运行结果界面 ,对于代号为‘10 ’的未知电话号码 ,得到与该 电话 33,1383 46。

经过进一步的非常分析 ,认为‘10 ’所代表的移动电 话号码为‘1363 结束语本文以电信的通话记录为数据挖掘对象 ,在数据 预处理的基础上 ,采用模糊集的谓词关联度算法用于 数据挖掘 ,从而可以找出不同用户的相关性 ,甚至是 同一客户拥有的不同移动电话号码 。该平台运行结 果与实际状况相符 ,效果良好 。当然 ,基于通话记录 的数据挖掘还可以进一步扩充 ,为电信企业提供更多 有用的信息。 参考文献 iaweiHan, ichelineKambr. Dat iningConcep 北京:机械工业出版社 何新贵.模糊知识处理的理论与科技 国防工业出版社 2000,28 2004,40 2,24 利用数据仓库和数据挖掘实现电信决策支持平台 系统运行结果界面(上接第 35 服务请求者可以查询服务登录中心寻求所需的服务 或者在已经了解服务提供者的服务提供站点地址的 情况下直接通过 议来看到所需的服务。 结束语CPC平台为企业的信息集成跟应用集成提供了 一个统一的集成框架 ,其所集成的应用可以按照企业 需求灵活调整 。不同的企业因为在市场特性 、规模 研发管理水准等方面存在着变化,在推进 CPC 需要按照自身的必须跟特征,进行具体的意愿分析 明确CPC项目的施行目标网络电话通话记录,确定实行范围 ,从而建立 出适应并推动企业发展的协作信息支撑体系 MylonakisJohn. Mass cust om isat ion: usefulmarket ing too evaluated wooppo2 sit businessendeavours[ Internat ional Journal Serv2ices, Techno logy AberdeenGroup. Collaborat ive roductcomm erce: delive2 ring roductinnovat ions internet speed iewpoint 1999,12 EB/OL /www.am team. org, 2002207208. 2003,39 70274. 面向协同产品商务的企业信息集成系统研究 2005,11 iuZhi,W ang Tianzhou. goal2oriented modeling lementing app roach fo collaborative roductcomm erce IEEEInt ernat ional Conference Cybernetics, 2005: 261422619. KimWoongsup, ChungMoon Jung, et al. ecture using semant ic ebservices fo collaborative rod2uct comm erce Computers Industry, 2006, 57 IIIPInc. IIIPReference rchitect ure[ EB /OL org/, 2004205218. Grabowski etal. DRA GON: developm ent interact ive engineering port al fo opennet works ICeCE,2001: 1452152.


本文地址:http://www.tonghuachaxuns.com//guanyuwomen/6638.html