友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
九色书籍 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

重生之王牌黑客-第176章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



  “小远,你们创建开源社区的经费从哪里來,我刚才听你的意思,开源社区要从玄涅独立出來,恐怕你也不打算用玄涅公司的钱了吧?”杨静宸问道。
  “是的,这个我來解释吧。”段炎月接过话头,说道,“和玄涅公司虽然都在用玄涅这个名字,但是玄涅开源社区是独立运营的,在财务上,也将会从玄涅公司完全独立出來,我们准备先设立一个捐赠账号,接受外界捐赠,玄涅前期对玄涅论坛的投资,到时候会以这种形式转移到捐赠账号上。”
  “可是那样的话,你们还是缺少一定的流动资金,要想把事业做大,恐怕是远远不够的,更何况你们还要在学校部署服务器,这些经费从哪里來?”杨静宸又问道。
  “肖远说,经费他会想办法,另外,我也有些存款,可以拿出來用。”段炎月说道。
  “小远,你哪來的钱?不会是要打你爸爸临走前委托我替你保管的那九百万的主意吧?你需要的话,我可以先给你一部分,但是不能全给你,这是你爸爸交代过的,。”杨静宸问道。
  “那九百万您还替我保管着吧,我有钱,还用不到那九百万。”肖远说道。
  “你哪來的钱?”杨静宸问道,不待肖远回答,又有些恍然道,“对了,妈妈倒是忘了,玄涅公司也是你的。”
  肖远笑了笑,洠в薪馐停疽泊τ诖匆灯冢岩膊豢碓#'有打算从那里拿钱,投资开源社区,他准备用的是唐飒从顾晓东那里赢來的钱,用这些钱他还有一个小小的恶趣味心理,每每想到用敌人的钱來做自己的事业,都会感到心里一阵舒爽。
  谈到这里,事情基本上已经确定了,接下來就是付诸行动,按部就班的实施了。
  段炎月继续对那份计划书进行完善,对将來社区的运营进行思考,设计,为开源社区的真正开始运营做准备。
  肖远的任务则是对玄涅现有论坛系统进行调整,更重要的是,他要按照自己的想法,做出一套自己心目中理想的linux发行版出來,这个发行版会是玄涅开源社区建设初期最重要的一个核心产品。
  杨静宸则是答应肖远和段炎月,尽快给他们落实教育网带宽的事情。
  这时,天已经快黑了,肖远本想留段炎月在家吃晚饭,但是她婉拒了,见她拒绝,肖远也洠в性倜闱克鬃园阉妥撸倩氐搅思业氖焙颍罹插啡炊运投窝自碌墓叵挡嘶骋桑盟行┛扌Σ坏谩
  “妈,你怎么能这么想呢,飒姐和夏九滢的事情我现在还洠肭宄趺创砟兀睦锘垢艺腥瞧渌俊
  “知道就好,唐飒和夏九滢的事情你也要尽快处理,这种事情不能拖,拖得越久越麻烦。”杨静宸说道。
  “妈,其实我比你还心急,如果能马上处理好,我绝不会多拖一分钟,不过处理这种事情本身就比较麻烦,也需要一个过程,算了,不说了,我回屋了,一会儿吃饭的时候,喊我一声。”
  肖远说完后,上楼去了。
  回到房间,肖远把唐新宇给他的那份关于搜索引擎的企划书拿出來,打开看了起來。


第302章 自然语言处理
  企划书很厚,两三百页,内容写得很详细。
  肖远在翻看的时候,并洠в腥ブ鹱种鹁涞亩粒导噬弦矝'有那个必要,他只需要通过企划书,把握其中的脉络和关键,对唐新宇和顾狼的想法有所了解就行了,好在企划书虽然厚,但是条理很清楚,所以肖远读起來也不费事。
  在肖远把企划书读到一半的时候,杨静宸在外边喊他吃饭,于是他暂停了阅读,起身出门吃饭去了。
  吃过饭后,他跟随老妈去了书房,想要问她一些事情。
  “怎么,还要妈帮你做什么?”书房里,杨静宸问道,很显然,她以为肖远还要说开源社区的事情。
  “不是,我想问问,您对中文自然语言处理知道多少,实验室有洠в兴谘芯空飧觯俊毙ぴ段实馈
  “为什么想起问这个了?”杨静宸问道。
  “玄涅公司准备做一个全文搜索引擎,目的是想让用户通过在搜索框输入日常用的语言,搜索引擎应该能够自动对他们的语言进行分析理解,然后从网络上海量的网页中搜索到他们想要的信息,这里面需要用到自然语言处理。”肖远说道。
  “全文搜索引擎?”杨静宸眼前一亮,由衷道,“这个想法好啊,如果能做成,比玄涅现在主要经营的玄涅防火墙,更有前景,更容易做成大产业。”
  “是的,我们也是看到了这一点儿,但是这其中有一些既需要理论支持,又需要大量基础工作的东西,自然语言处理也在其中,而且很重要,您不是人工智能专家吗,所以我才想到问问您。”肖远说道。
  “自然语言处理严格來说,应该是一个以人工智能为核心的跨学科研究方向,它牵涉到的,不仅仅是计算机和人工智能,还牵涉到语言学,心理学等其他社会学分科,虽然这个学科在西方起源挺早,四十年代就有了,但是自然语言系统太过复杂,所以,直到现在,全世界范围内,也洠в惺裁赐黄菩越埂!
  杨静宸显然对这个领域很熟悉,给肖远介绍了一下当前国际上关于这方面的研究情况,然后又说了国内的研究情况:“咱们国内对这方面的研究,相比国外,还处于一个水平更低的基础信息积累阶段,一方面是因为国内的起步比西方晚,二來,是因为,中文和西方拉丁语系的那些语言有很大不同,拉丁语系是拼音语系,而且句式本身就是结构化的,所以计算机处理起來也相对容易,但是中文却是一种古老的象形文字,句式灵活随意,充满了各种虚词助词,想将这样的语言转化成计算机可以分析处理的形式,本身就是一个很大的难睿!
  “嗯,这倒是事实,那么咱们国家现在的研究状况究竟是什么样子的?”听了老妈的话,肖远稍稍有些失望,前世他也只是稍稍关注过这方面的理论,具体的细节了解也不是太多,于是就想更深入的了解一些。
  “现在国内进行这方面研究的,主要是几个大学,其中京华大学的研究比较前沿,国内其他大学在这方面的研究,也大都在配合京华大学的研究,做一些基础词库整理工作,妈的实验室也有人在做这方面的研究,主要承担的是h到p的词汇整理建库工作,目前完成度已经到百分之八十了。”杨静宸说道。
  听了杨静宸的介绍,肖远说道:“基础词库大概什么时候能够建好?”
  “这个很难估计。”杨静宸说道,说完看到肖远眉头皱了起來,又说道,“你要真的想在搜索引擎中使用自然语言处理算法,妈倒是能给你一些建议。”
  肖远用询问的目光看着老妈,等着她继续。
  “人们要利用你说的搜索引擎在网上检索信息的话,我想他们用的最多的,肯定不会是完整的句子,而是一些关键词,或者一些短句,仅仅分析关键词和短句的话,难度就洠в心敲创罅耍夷阋矝'必要一下子就把产品做的那么完美,人们以前从來洠в薪哟ス庋牟罚裕恍枰恍┘虻サ闹悄苄裕妥阋远杂没Р愎坏奈α恕!毖罹插匪档馈
  肖远点了点头,说道:“这个我自然是知道的,不过咱们国内的研究状况让我有些失望罢了,第一版肯定不能一下子往里面放太多的东西,只需要做出一个基本的东西,然后根据用户的反馈和新技术的成熟,再扩充,让它越來越完善,这好像是软件工程上有名的xp编程。”
  “你知道xp编程?”
  杨静宸却是因为肖远提到xp编程感到很惊讶,大概是想不到肖远还会去看软件工程方面的书吧,更何况xp开发方法还是近几年才有人提出來的一种很新的方法。
  “了解一些。”肖远却是洠в邢氲阶约核婵诘囊痪浠埃寄苋美下韪械骄龋谑蔷桶鸦邦}又拉回了正睿档溃奥瑁业褂懈鱿敕ā!
  “什么想法?”杨静宸问道。
  “我想让玄涅搜索和你的人工智能实验室进行深度合作,一方面,你们能够从玄涅得到一定的资金支持,而且你们还可以利用玄涅搜索所采集的海量网络信息资源,另一方面,玄涅也能够第一时间将你们的研究成果应用到自己的产品中,提升公司的技术含量,我认为这是一件双赢的事情。”肖远说道。
  “学校科研和企业合作,尽快转化成生产力,是咱们国家一直提倡的,人工智能实验室这些年,也一直在寻求与企业合作,联合研发,所以,如果玄涅想要合作的话,实验室当然欢迎了。”杨静宸说道。
  “那好,等时机成熟后,我让唐新宇和你们谈,具体过程我就不参与了。”肖远说道。
  ……
  和老妈又聊了一会儿,肖远再次回到了自己的房里,把企划书看完,思索片刻,他拿出纸笔,开始构思玄涅搜索引擎的技术架构了。


第303章 玄涅重组
  虽然后世以百度、谷歌为代表的搜索引擎最终呈献给用户的,只是一个只有一个搜索条和一个搜索按钮的简单页面,但是隐藏在页面后台的却是一个由成千上万台服务器,天文数字级的海量数据,以及一个复杂的搜索引擎软件组成的庞大系统,而这个系统的核心,就是搜索引擎。
  搜索引擎虽然很复杂,但是其系统总体架构却并不复杂,主要由网络数据采集模块,数据分析排序模块,数据库,用户查询请求分析模块等组成,起工作流程也很简单:网络数据采集模块是一个很重要的模块,其主要功能是从网络上抓取网页信息发送回搜索引擎服务器,这个模块有一个很形象的名字,叫做网络蜘蛛,也有人把它叫做网络机器人,之所以叫网络蜘蛛,是因为蜘蛛会踩着它吐的蛛丝在网上漫步,而网络蜘蛛虽然自己不吐丝,但是互联网上的超链接却将无数的网页连接成一个巨大的网,网络蜘蛛则会在这个网上不停地到处爬行,采集网页信息,之所以叫网络机器人,却是因为这种爬行搜索的过程,是完全自动化进行的缘故。
  网络蜘蛛将搜集到的网页信息,发送回搜索引擎服务器,由网络数据分析模块对之进行分析,按照一定的算法,给每个网页赋予一定的权重,将网页进行排序。
  判断一个搜索引擎的优劣,很大程度上,取决于这个排序算法,一个优秀的全文搜索引擎,能够通过优化排序,让用户第一时间得到自己想要的信息,而不用继续往下翻页,所以,这个排序算法将会是整个搜索引擎最核心的技术。
  对此,肖远自然也是十分熟悉的,实际上,他并洠в写蛩愦油分廖沧约憾懒⑷ネ瓿伤阉饕娴目ⅲ亲急冈谛榻ㄒ桓隹⑿∽椋餐献鱽硗瓿烧鱿低车目ⅲ牵承畔⑷ㄖ胤峙浜团判蚰?椋魑渲凶钪匾詈诵牡牟糠郑词且约呵鬃钥⒌模以诳⑼瓿珊螅够峤魑咀詈诵牡募际趸埽昵胱ɡ梅啥云浣斜;ぁ
  至于其他非核心的模块,即使是网络蜘蛛这样的重要功能模块,在搞清楚工作原理后,开发并不困难,所以,他准备交给开发小组來做,自己就不亲自动手了。
  一套完整的搜索引擎开发文档,也不是一时半会儿能够做出來的,肖远晚上只是在草稿纸上画了一些架构图和流程图,然后就上床睡觉了。
  从第二天开始,肖远整整花了三天时间,才把整个系统的总体结构设计文档写了一个初稿出來,然后他去了玄涅公司,把唐新宇和顾狼召集在一起,反复对开发文档进行了探讨,修改,数易其稿,如此一來,很多天就匆匆过去了。
  与此同时,唐新宇也开始着手对玄涅网络科技股份有限公司进行结构调整,成立了一个网络安全事业部,将以玄涅防火墙为核心的网络安全产品及相关业务,全部划归到了网络安全事业部。
  与网络安全事业部并立,唐新宇开始着手组建搜索引擎事业部,而顾狼也按照预定计划,配合唐新宇,着手组建搜索引擎开发小组。
  段炎月这段时间除了继续完善玄涅开源社区建设计划书之外,也在着手组建玄涅的第三个特殊的事业部…………玄涅开源事业部,之所以说这个事业部特殊,是因为这个事业部和其他两个事业部不同,它虽然名义上隶属于玄涅公司,但是无论财权,还是经营权,都是完全独立的,在建立这个事业部后,段炎月也正是开始着手招人,进行开源事业部的组织建设了。
  杨静宸也在上次与段炎月会面后,于一周后,在学校为玄涅开源社区准备组建的高校开源软件联盟争取到了400mbps的免费网络带宽,这个带宽在高校开源联盟建设初期,也暂时够用一阵
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!