第二层:数据工厂
作为一个人,要调取某部分的记忆,就会很自然的联想到某个词,某个画面,某个音乐等等就能记起很多事情,比如当你听老歌时,看到童年的玩具时,汹涌的记忆总会被调出来。当然这是因为人类大脑的神经连接结构允许我们这样去检索,而机器是不允许的,数据存储在硬盘上,机器想要找到某个数据,必须一个个访问过去,机器没有分类的概念,就像在图书馆中,机器是一个不会看分类的管理员,他要找某一本书时只能一本一本的找过去,十分笨拙。
也就是说,机器要想搜索什么内容时,必须有人来帮助它建立起分类,但最矛盾的就是,在错综复杂的语言结构中,我们很难为一个词去下定义,比如当你在说“苹果”这个词的时候,你如何告诉机器他的分类?"苹果"究竟是一个名词,还是一个公司?而决定一个词的意义的则是语境,也就是机器要依靠其他词语的出现来为这个词做模糊的定义,不能完全给它下死定义而是要根据环境来下,并且它还应当是动态的,不断变化的。
也就是说这种搜索技术也依然要百度的大脑配合才能达到,对每一个词的定义应该是一个库,而这个库中的每一个词又都各自构成库,百度的数据工厂所创造的算法,就是在这么一个数据之海中去为他们建立管理,然后去索引。
数据工厂相当于人脑中的记忆关联过程:将某个词同时与其他词或是某个场景等等建立起动态关联的过程。
娱乐圈中被包养的女星数不胜数,包养男人的女星也数不胜数,但是很多女星被包养后还死 ...
讲到女性做爱至高潮算得上是一件很神秘的事情,因为男女之间的区别,男性在高潮时伴有 ...
近日,一美国19岁女孩在图书馆里面不管不顾公众场所,公然自慰事件引起了网友们的关注 ...
昨天,院长写了一篇关于电影《大只佬》的原版解析。这部当年囊括23届金像奖多个奖项的 ...
据韩国媒体日刊体育报道,《RunningMan》改版,金钟国被裁,宋智孝也被节目组抛弃。宋 ...