Archive for 搜索引擎算法研究

  • 09
  • Dec

 BP网络结构
   对于多层前馈神经网络,目前广泛采用的是Romclhert和McClclland与1985年提出的误差逆向传播算法,即BP算法。这种网络结构如图所示:

它实际上是一个多层感知器,由输入节点、输出节点以及隐层节点(一层或多层)组成。同层节点之间没有连接,前一层和后一层之间相互充分连接。
激活函数
对于输入信号,先前向传播到隐节点,经激活函数作用后,最后由输出节点给出结果。对于激活函数的要求是一个连续可微、非减的函数,如下图:

BP网络是完成 m维空间向量对n维空间的近似映照。由于f(x)采用非线性函数,其具有一定的容错范围,这使BP网络比一般的线性阈值单元的网络有更方便的灵活性。

  |  Tags: ,

  • 07
  • Dec

神经网络基本概念 
人工神经网络(ANN)的发展,可追溯到一个世纪以前。而最近几年则发展为十分热门的交叉学科。它涉及生物、电子、计算机、数学和物理等学科,采用物理可实现的器件或现有的计算机来模拟生物体中神经网络的某些结构与功能,并使之运用于工程或其它领域。人工神经网络的着眼点不是用物理器件去完整地复制生物体中的神经细胞网络,而是采纳其可利用的部分来克服目前计算机或其它系统不能或难以解决的问题,例如:自动学习、模式识别、智能控制及专家系统等。随着生物和认识科学的发展,人们对人脑的结构以及认识过程的了解进一步地深入,人工神经网络技术的发展与应用将会有更加广阔的前景。

  |  Tags: ,

  • 06
  • Dec

目前seo们主要操作手法,判断竞争程度,研究搜索引擎的脾气,这些都是通过实验看到的现象去反推测本质,这种推测法难免有它的弊端。并且每个seoer可能都有自己的实验结果,并不统一,有时候甚至同样的两个实验得到的结果却是矛盾的。
而这种利用结果去反推原因的方法,事实上在工程应用中早就有专门的软件工具,可以利用若干实验样本去推测中间的函数过程,当然这个函数可以是模糊的。
工程实验仿真工具matlab 
matlab就是这样一种软件,MATLAB是矩阵实验室(Matrix Laboratory)之意。除具备卓越的数值计算能力外,它还提供了专业水平的符号计算,文字处理,可视化建模仿真和实时控制等功能。
精灵使用matlab截图:

人工神经网络ANN 
人工神经网络是今年来比较流行的一种仿真实验方法。它涉及生物、电子、计算机、数学和物理等学科,采用物理可实现的器件或现有的计算机来模拟生物体中神经网络的某些结构与功能,并使之运用于工程或其它领域。
利用人工神经网络计算serp规律 
精灵考虑利用matlab和神经网络进行seo优化效果评估,通俗的说就是利用若干seo实验结果去反推serp规律,通常的反推是利用真实的人脑,也就是我们seoer自己,而精灵这种反推是利用软件模拟我们人脑的思维。
该项研究进行中……
期间需要大量的seo实验样本,精灵还在收集中,当然,可能这项研究根本就是不可行的,精灵也不保证一定能成功,总之试试看吧。
精灵利用matlab训练人工神经网络截图:

  |  Tags: , ,

  • 08
  • Nov

网站的目录层次要尽量少
我们都知道站内优化要求网站目录层次结构尽量少,尽量不要超过三层,但又没有想过为什么呢?根据蚁群算法最短路径原则,你的目录层次结构短,有助于你的网站所在的总路径最短,以增加你的网站权重。
尽量找高质量的相关度高的站做外链
这也就是一直在提倡的链接策略,根据蚁群算法信息素原则,如果一个高度相关的站指向你,也就是说你所在的蚂蚁组最终觅食地点就是你要做的关键词组,热如果一个相关质量高的站只想你,可以说你就站在了一个信息素极高的路径上,由于该路径分布着极高的信息素,也就极有可能成为最终蚂蚁选择的路径。

  |  Tags: , , ,

  • 07
  • Nov

蚁群算法的应用进展
以蚁群算法为代表的群智能已成为当今分布式人工智能研究的一个热点,许多源于蜂群和蚁群模型设计的算法己越来越多地被应用于企业的运转模式的研究。美国五角大楼正在资助关于群智能系统的研究工作-群体战略(Swarm Strategy),它的一个实战用途是通过运用成群的空中无人驾驶飞行器和地面车辆来转移敌人的注意力,让自己的军队在敌人后方不被察觉地安全进行。英国电信公司和美国世界通信公司以电子蚂蚁为基础,对新的电信网络管理方法进行了试验。群智能还被应用于工厂生产计划的制定和运输部门的后勤管理。美国太平洋西南航空公司采用了一种直接源于蚂蚁行为研究成果的运输管理软件,结果每年至少节约了1000万美元的费用开支。英国联合利华公司己率先利用群智能技术改善其一家牙膏厂的运转情况。美国通用汽车公司、法国液气公司、荷兰公路交通部和美国一些移民事务机构也都采用这种技术来改善其运转的机能。鉴于群智能广阔的应用前景,美国和欧盟均于近几年开始出资资助基于群智能模拟的相关研究项目,并在一些院校开设群体智能的相关课程。国内,国家自然科学基金”十五”期间学科交叉类优先资助领域中的认知科学及其信息处理的研究内容中也明确列出了群智能领域的进化、自适应与现场认知主题。

  |  Tags: , , ,

  • 05
  • Nov

蚁群算法的特点
1)蚁群算法是一种自组织的算法。在系统论中,自组织和它组织是组织的两个基本分类,其区别在于组织力或组织指令是来自于系统的内部还是来自于系统的外部,来自于系统内部的是自组织,来自于系统外部的是他组织。如果系统在获得空间的、时间的或者功能结构的过程中,没有外界的特定干预,我们便说系统是自组织的。在抽象意义上讲,自组织就是在没有外界作用下使得系统墒增加的过程(即是系统从无序到有序的变化过程)。蚁群算法充分休现了这个过程,以蚂蚁群体优化为例子说明。当算法开始的初期,单个的人工蚂蚁无序的寻找解,算法经过一段时间的演化,人工蚂蚁间通过信息激素的作用,自发的越来越趋向于寻找到接近最优解的一些解,这就是一个无序到有序的过程。

  |  Tags: , , ,

  • 04
  • Nov

经过一定时间,从食物源返回的蚂蚁到达D点同样也碰到障碍物,也需要进行选择。此时A, B两侧的信息素浓度相同,它们仍然一半向左,一半向右。但是当A侧的蚂蚁已经完全绕过障碍物到达C点时,B侧的蚂蚁由于需走的路径更长,还不能到达C点。如图3所示。
 
图3 蚁群在障碍物前经过一段时间后的情形

  |  Tags: , , ,

  • 02
  • Nov

蚁群算法的由来:
蚂蚁是地球上最常见、数量最多的昆虫种类之一,常常成群结队地出现在人类的日常生活环境中。这些昆虫的群体生物智能特征,引起了一些学者的注意。意大利学者M.Dorigo,V.Maniezzo等人在观察蚂蚁的觅食习性时发现,蚂蚁总能找到巢穴与食物源之间的最短路径。经研究发现,蚂蚁的这种群体协作功能是通过一种遗留在其来往路径上的叫做信息素(Pheromone)的挥发性化学物质来进行通信和协调的。化学通信是蚂蚁采取的基本信息交流方式之一,在蚂蚁的生活习性中起着重要的作用。通过对蚂蚁觅食行为的研究,他们发现,整个蚁群就是通过这种信息素进行相互协作,形成正反馈,从而使多个路径上的蚂蚁都逐渐聚集到最短的那条路径上。
这样,M.Dorigo等人于1991年首先提出了蚁群算法。其主要特点就是:通过正反馈、分布式协作来寻找最优路径。这是一种基于种群寻优的启发式搜索算法。它充分利用了生物蚁群能通过个体间简单的信息传递,搜索从蚁巢至食物间最短路径的集体寻优特征,以及该过程与旅行商问题求解之间的相似性。得到了具有NP难度的旅行商问题的最优解答。同时,该算法还被用于求解Job-Shop调度问题、二次指派问题以及多维背包问题等,显示了其适用于组合优化类问题求解的优越特征。
多年来世界各地研究工作者对蚁群算法进行了精心研究和应用开发,该算法现己被大量应用于数据分析、机器人协作问题求解、电力、通信、水利、采矿、化工、建筑、交通等领域。
蚁群算法之所以能引起相关领域研究者的注意,是因为这种求解模式能将问题求解的快速性、全局优化特征以及有限时间内答案的合理性结合起来。其中,寻优的快速性是通过正反馈式的信息传递和积累来保证的。而算法的早熟性收敛又可以通过其分布式计算特征加以避免,同时,具有贪婪启发式搜索特征的蚁群系统又能在搜索过程的早期找到可以接受的问题解答。这种优越的问题分布式求解模式经过相关领域研究者的关注和努力,已经在最初的算法模型基础上得到了
很大的改进和拓展。

  |  Tags: , , ,