Cadd3aba2bd26d87d7889ef002324998
[核心提示] 传统的骚扰电话解决方案是基于本地的黑名单机制,但是这种方式局限性很大, 骚扰号码没有规律可循,无法类似 E-mail 那种 bayes(贝叶斯)的自我学习功能,扩展性也很差。搜狗号码通在本地基础上加入了云的概念,即通过搜索蜘蛛的抓取分析建立一个“号码云”。

搜狗近日上架一款号码辅助识别软件——号码通,通过抓取互联网中的公开电话信息,建立起海量号码数据库,让诈骗,中介,推销等骚扰号码无处遁形。软件还专门设计“标记”功能,每一个用户都可以对陌生的骚扰号码进行分类标记,同时每个用户对骚扰号码的评价将分享给其他用户,彻底摆脱接到骚扰电话后的自认倒霉的无奈,让层出不穷的骚扰电话彻底歇菜。充分利用智慧众包,让那些漏网的骚扰电话瞬间陷入人民战争的汪洋大海之中。

号码的云计算

传统的骚扰电话解决方案是基于本地的黑名单机制,但是这种方式局限性很大, 骚扰号码没有规律可循,无法类似 E-mail 那种 bayes(贝叶斯)的自我学习功能,扩展性也很差。这个已经是标配技术。搜狗号码通在本地基础上加入了云计算的概念,即通过搜索蜘蛛的抓取分析建立一个“号码云”,这也是搜狗基于搜索引擎做号码通的出发点,相当于防通讯骚扰的云计算。它的好处是让 APP 客户端很轻,直接和“号码云”交换匹配即可。

(部分内容来源于知乎

釜底抽薪之道

骚扰诈骗电话要真正的杜绝,还是要从根源下手,通信运营商从源头来做,根据呼叫记录,自动找出异常呼叫,进行跟踪和查处,从源头打击,不过,遗憾的是,垃圾电话和垃圾短信符合运营商短期利益,要真正的釜底抽薪,还需要一点时间。

题外话——众包

号码通的核心功能在于通过用户的标记来识别骚扰电话,再将用户的标记数据共享到服务器,操作模式和方法类似于搜狗输入法的流行词库一样,都是运用大众的智慧共建数据库,实现分享。无独有偶,Google 旗下的 Google Books 也借用了民众的力量去完成纸质书的数字化。Google Books 扫描了几十万本纸质书,通过 Google 实验室项目 reCAPTCHA ,扫描后的图片被裁减成一个个单词片段,用于网站防止机器注册时显示的验证码,人们在输入验证码的同时不知不觉就完成了图书数字化过程。世界各地图书馆有很多受损的古籍,页面泛黄、纸张脆弱,OCR 是无能无力的,它无法识别褪色的和模糊的文本,而人类在这方面有卓越的表现。reCAPTCHA 将我们输入的验证码正确识别后,拼接、排版,在化整为零中就完成了古籍的数字化。

当然,有人可能会提到防骚扰红名单,但是,红名单是你用的吗?

 
行业趋势通讯移动互联网产品观察

已有5条回复我要回复

Medium af90b142ff2cd24e1340e4b6efe5a55f
Afio·2012-04-29
红名单估计是没指望了,还是自己弄个白名单吧。
Medium 4a0fc2f197f6d28f4a0dc106065487b0
Procaine·2012-04-29
应该建立个无良商家名单,把泄露个人信息的商家整合进“号码云”
Medium 892be916ae6cd16c8e6d9319585e34e4
listen1999·2012-04-29
取证很难啊。
Medium accbe7c59340d609c64c2a4681e141fc
depthsky·2012-05-02
现在搜狗号码通的原理就是这样滴~
Medium e3e16f513001e1fab38bc4bb161686c3
5thd_geek·2013-04-29
云中的垃圾号码数据库很大吧?怎么发送到手机上起到实时的拦截作用呢?
Default avatar