永发信息网

用java做一个教育资源的基于概念语义查询扩展的智能搜索引擎系统,具体步骤是什么?

答案:2  悬赏:0  手机版
解决时间 2021-03-08 12:38
  • 提问者网友:嘚啵嘚啵
  • 2021-03-08 02:07
我是一名研二的学生,专业是计算机,我的java水平很差,是自学的,从来没有接触过搜索引擎方面的知识,我看了好多这方面的论文,但是只明白原理,但具体怎样做还不知从何下手,想问要补哪些课?

lanangle@163.com我的邮箱
最佳答案
  • 五星知识达人网友:孤独入客枕
  • 2021-03-08 03:01
你可以做一个基于你本学校网站的搜索引擎,这个应该很容易实现1。第一步:先用网络爬虫将你学校网站上的网页抓取下来,存放在本地(对于每个网页根据其内容赋予不同的权值,这里的权值,怎么说呢,这个网页的主要内容吧~);第二不:可以用jsp写一个搜索引擎网站;第三步:编写中文分词代码(当然现在已经有很多成熟的软件);第四步:上网搜一些什么根据关键字查找本地网页的算法(这一步最关键,这个应该是最难的,我感觉);第五步:剩下的我感觉应该很容易了,接收用户输入,分词,提取关键词汇,查找本地网页数据库,显示查找结果(那些快照就是本地保存的网页)。 这只是一个小型的娱乐型搜索,还要用网络爬虫定期更新本地存放的网页。(补充:如果你想做的更好,可以用多标签分类,每个网页是一个bag,含有多个instance,每个instance包含多个attribute,根据多标签分类可以查找到更多的网页,给用户更多的选择。只是我的一点建议,我今年大三,我做过一点网络爬虫,中文分词,多标签分类,jsp。) 对了,又看了一下问题,你是要做基于概念语意的搜索引擎,之前我做过一个东西用到了董镇东他们的HowNet,有一个词汇语意相似度的计算,我的理解呢:根据用户输入的文本,分词,查找语意相似度非常大的词汇(比如:用户输入“关公”,我们不应该只返回“关公”的网页,我们要把“关二爷”、“武圣人”、、、相关的网页都返回给用户,还有一点:我们可以在下面给出选择,把那些相似度非常小,也就是反义词,列出来,根据人类的习惯,好多时候下会想到反义词,这样我感觉能给用户更好的感受)。仅仅是个人意见,仅供参考。有什么问题我们可以一起商量。
全部回答
  • 1楼网友:西岸风
  • 2021-03-08 03:44
你好! 我给,baidu hi联系,email? Q? 如果对你有帮助,望采纳。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯