缠绵比以往任何一次都热烈。
贾瀞雯咬住陈浩的肩膀,不让自己发出太大的声音。
陈浩的手指在她背上留下痕跡,像是要確认她的真实存在。
结束后,两人浑身是汗,却谁也不想动。
“想你了。”陈浩在她耳边说。
“我也是。”贾瀞雯把脸埋在他胸口。
他们就这样躺了很久,直到呼吸平復。
陈浩忽然坐起来:“对了,有件事要教你。”
他打开檯灯,从床头柜拿出一张纸和一支笔。
“你看,怎么向不懂技术的人解释技术。”他在纸上画了个简单的图,“比如分词算法,你可以这样说--”
他在纸上写下一句话:“我爱北京天安门。”
“普通人看到这句话,知道是什么意思。
但计算机看到的是一个个汉字:我、爱、北、京、天、安、门。
它不知道『北京是一个词,『天安门是一个词。”
他在“北京”和“天安门”下面画了线。
“分词算法就是教计算机认词。
就像教小孩认字,先告诉他『苹果是一个整体,不是『苹和『果。
然后他看到『红苹果,就知道『红和『苹果是两个词。”
贾瀞雯看著那张纸,忽然明白了。
“所以你总是用比喻。”她说,“爬虫像蜘蛛,索引像图书馆目录,排名算法像选举投票。”
“对。”陈浩放下笔,“技术细节留给技术人员,但你要理解核心理念。
这样你和团队沟通,和投资人沟通,和未来的用户沟通,才能说到点子上。”
他躺回来,搂住贾瀞雯:“记住,我们不是在造一个高科技玩具,是在解决真实的问题。
人们上网找不到想要的信息,我们帮他们找。
就这么简单。”
第二天,贾瀞雯带著那沓手稿飞回北京。
团队看到新资料,又是一阵兴奋。
陈浩细化了很多关键算法,特別是排名算法的雏形--他提出了“连结分析”的概念,一个网页被越多网页连结,说明它可能越重要。
“这个思路太妙了!”张涛几乎要跳起来,“这就像学术论文的引用,被引次数越多,说明越有价值!”
有了明確的方向和详细的方法,进度快得惊人。
两周后,贾瀞雯正在办公室看財务报表,李明冲了进来。
“贾总!成了!”
他手里拿著一张列印纸,手指都在抖。
贾瀞雯站起来:“什么成了?”
“爬虫!基础版本的爬虫跑起来了!”李明把列印纸递给她,“这是日誌,你看,已经抓取了三百多个网页!”
纸上是一行行的记录:
[xxxx-xx-xx10:23:15]开始抓取种子网站:news。xxx。com
[xxxx-xx-xx10:23:17]发现连结:
[xxxx-xx-xx10:23:18]抓取成功,大小:4。2kb
[xxxx-xx-xx10:23:19]发现连结: