昔日“华为少帅”李一男,在众里寻他“签”百度之后,18日首度以百度首席技术官身份公开亮相。
与其一起撩开神秘面纱的,还有百度“雪藏”多年的“阿拉丁计划”,及百度上海研发中心。百度CEO李彦宏为此专门飞赴上海。
“百度有2000名核心工程师,现在有超过1000名技术力量投入到‘阿拉丁平台’研发。”李一男表示,“之后,会有更多工程师加入到这一搜索‘暗网’团队中。”李一男说。
此次上海亮相,是李一男加盟百度后的“处子秀”。作为百度CTO,这位业界公认的“技术天才”,在接受李彦宏邀请执掌百度技术后,会将百度带向何方,业界充满好奇。
李一男介绍说,互联网上有大量Hidden Web,也就是“暗网”存在。目前能被搜索引擎检索到的信息,只占人类所有信息中很小一部分,大量信息仍然处在“未知世界”当中。有数据显示,“已知”在“未知”中的比例大约为千分之二。“阿拉丁计划”,是为解决现有搜索引擎无法抓取和检索“暗网”信息而来。
“这一方面是因为,目前很多人类信息并没有实现Web化,另外一方面,即使是一些已经Web化的信息,也因为没有纳入到搜索引擎检索体系,而无法被人们便捷地获取。”艾瑞咨询总裁杨伟庆表示。
“如果我们把百度搜索引擎比做一个探照灯,在无边无际的信息宇宙中扫射并且记录,那么,那些探照灯从来扫射不到的区域,都是‘暗网’。如何将这些已知和未知信息分门别类地融合,有序地纳入到我们的知识范畴,并且能够为广大互联网用户提供零成本、无障碍、无时差精准送达,是有史以来我们在技术上面临的最大挑战。”李一男解释说。
在李看来,对Hidden Web的抓取,仅仅是“阿拉丁计划”的“试水”,更高层次搜索还在于,它将对Hidden Knowledge,也即对人类“未知的知识”进行挖掘和整理。