http://www.chinalibs.net 2024/6/14
[作者] 贾广胜,范波,高原,林广文,张一媚
[单位] 山东出版数字融合产业研究院有限公司
[摘要] 本发明公开了一种基于出版物内容的竞争出版社识别方法,包括以下步骤:获取出版社的所有图书列表;取出需要识别的图书m,并对图书m的书名及摘要进行特征词抽取;根据word2vec的图书内容特征向量表示方法和大数据检索过滤策略的图书相似性计算方法得到图书的相似度值;取出相似度值接近的图书作为内容相似图书;对相似图书的出版社进行检索和对相似图书的出版社的竞争强度计算;判断计算的相似图书获得的最终的竞争出版社集合及相应出版社的竞争强度值。本发明能够有效的摆脱专家参与、使得竞争出版社的识别采用自动化的方式完成,不仅精准的分析出图书的相似内容还能够判断出竞争强度,提高了工作效率。
本发明公开了一种基于出版物内容的竞争出版社识别方法,包括以下步骤:获取出版社的所有图书列表;取出需要识别的图书m,并对图书m的书名及摘要进行特征词抽取;根据word2vec的图书内容特征向量表示方法和大数据检索过滤策略的图书相似性计算方法得到图书的相似度值;取出相似度值接近的图书作为内容相似图书;对相似图书的出版社进行检索和对相似图书的出版社的竞争强度计算;判断计算的相似图书获得的最终的竞争出版社集合及相应出版社的竞争强度值。本发明能够有效的摆脱专家参与、使得竞争出版社的识别采用自动化的方式完成,不仅精准的分析出图书的相似内容还能够判断出竞争强度,提高了工作效率。
详情请下载:一种基于出版物内容的竞争出版社识别方法.pdf
引用本文:
贾广胜,范波,高原,林广文,张一媚.一种基于出版物内容的竞争出版社识别方法[DB/OL].[2025-05-19].http://www.chinalibs.net/ArticleInfo.aspx?id=592837.
温馨提示:
如果您的作品引用了本文,请您发邮件(leisun@chinalibs.net )告诉我们,我们会给您一个小小的惊喜哟!
——【北京雷速科技有限公司】