• 危险食品再出新产品人工合成鱼 2018-03-28
  • 里皮拿出全部“家底”出战中国杯 鲁能三将入选 2018-03-28
  • 居民春节出游成新时尚 山西旅游揽金近63亿元 2018-03-28
  • 辽足想复兴要先打好地基 2018-03-28
  • 【小说】网游玄幻之老子天下第一网游玄幻之老子天下第一最新章节全集下载 2018-03-28
  • 青海网上技术交易后补助实施细节 2018-03-28
  • 集合啦!西安网亲子健身体验活动 2018-03-28
  • 汪洋王沪宁分别参加全国两会一些团组讨论和审议 2018-03-28
  • 芜湖百姓热议政府工作报告 2018-03-28
  • 远大中粮绿色住宅高峰交流会在京举办 2018-03-28
  • 在家请客吃饭,没有这几道必杀菜怎么行! 2018-03-28
  • 奥朗德亲自撰写新书 首谈“门徒”马克龙参选 2018-03-28
  • 荣耀Waterplay平板32G Wi 2018-03-28
  • 丁业现强调:创新发展思路 为西藏改革发展稳定注入强劲活力 2018-03-28
  • 特朗普新任经济顾问好打嘴炮立场混乱 称对中国更强硬 2018-03-28
  • 17年重庆时时彩骗局>专利首页>对小说网页内容选择性抽取方法和装置

    对小说网页内容选择性抽取方法和装置

    摘要:
    本发明提供了一种对小说网页内容选择性抽取方法和装置,该方法包括:将目标小说网页解析成文本对象模型树结构;对所述文本对象模型树结构中的各结点进行分类,以确定所述目标小说网页的结构分块;根据所述结构分块选择性抽取所述目标小说网页相应的结构化数据。本发明通过对文本对象模型树结构中的各结点进行分类,实现对小说网页进行结构分块,进而实现对信息丰富而复杂的小说网页的网页内容的有效抽取。
    专利类型: 发明专利
    申请(专利)号: CN201410575705.6 申请日期: 2014年10月24 公开(公告)日: 2015年02月04
    公开(公告)号: CN104331438A 主分类号: G06F17/30,G06F17/00,G,G06,G06F,G06F17 分类号:

    G06F17/30,G06F17/00,G,G06,G06F,G06F17,G06F17/30,G06F17/00

    申请(专利权)人: 北京奇虎科技有限公司,奇智软件(北京)有限公司 发明(设计)人: 魏少俊,郑燕琴 主申请人地址: 100088 北京市西城区新街口外大街28号D座112室(德胜园区)
    专利代理机构: 北京智汇东方知识产权代理事务所(普通合伙) 11391 代理人: 康正德,范晓斌 国别省市代码: 北京;11
    主权项: 法律状态:

    010-56181807

    周一至周五9:00-17:30

    中国终身教育数据服务平台--中国终身教育学术研究中心课题组中教汇据(北京)科技有限公司

    京ICP备15058941号-1Copyright ? 2013-2016 ZJHJ Corporation,All Rights Reserved

    京ICP证161029