|
|
1.
知识图谱数据结构化处理技术研究综述
辛登月, 施旭阳, 陈宇星, 魏芳盛, 王充
船舶
2026, 37 (03):
121-137.
DOI: 10.19423/j.cnki.31-1561/u.2026.008
数据预处理是知识图谱构建的核心环节,主要包括数据采集与信息提取两大步骤。该文系统梳理了基于规则和词典、统计机器学习与深度学习的主流数据预处理方法,深入剖析了各类方法在实体识别与关系抽取中的技术原理与应用局限性。现有方法普遍依赖人工规则,语义泛化能力弱,难以实现跨领域的知识迁移。为此,文中探讨了基于大语言模型的“语义驱动+自动化抽取”新范式,即通过预训练大语言模型生成深层语义嵌入,结合向量相似度计算实现无监督、上下文感知的信息抽取,从而推动知识图谱构建向智能化转型。当前该方法仍处于探索阶段,面临计算开销大、可解释性差等挑战。未来研究应聚焦于轻量化模型设计、多模态语义对齐与领域知识融合,以提升知识图谱构建效率和模型的可解释性。
参考文献 |
相关文章 |
多维度评价
|
|