版本:v1.0
外包方:XXX 科技
编写日期:2025-08-06
本系统旨在构建一个面向文本、图像、视频等多模态数据源的知识抽取与图谱构建平台,用户可通过系统上传资料,自动抽取知识实体与关系,构建结构化图谱,并通过交互式可视化界面进行浏览、分析、查询与推理辅助。
| 角色 |
权限说明 |
| 管理员 |
管理全局数据、用户、抽取模型配置等 |
| 普通用户 |
上传文件、查看与操作图谱 |
| 访客(可选) |
浏览公开图谱,权限受限 |
- 支持的文件类型:
- 文本:
.txt, .pdf, .docx
- 图片:
.jpg, .png, .jpeg
- 视频(可选阶段):
.mp4, .mov
- 批量上传支持(多文件)
- 文件大小限制(默认最大 100MB)
- 显示上传历史、文件状态、文件名、时间
- 文件删除与重新处理功能
- 分词处理、清洗冗余符号
- 命名实体识别(NER)
- 句子级关系抽取(SPO 三元组)
- 概念统一与标准化(如“OpenAI”/“open ai”归一)
- OCR 提取文字信息(如图中标注、标题)
- 图片中的文字送入实体/关系识别流程
- 支持标注图并关联原图位置(可选)
- 字幕提取(自动识别 + 支持外挂字幕)
- 视频关键帧截图
- 视频文本融合图谱
- 同一知识节点支持绑定多个模态资源
- 同一实体可通过不同模态来源补充属性/上下文
- 支持实体类型:人名、组织、事件、地点、概念、产品等
- 支持实体属性扩展(如:出生地、别名、图像、来源文档)
- 支持多模态属性:图片、视频片段、原始段落
- 自定义关系类型
- 同一实体间可存在多条不同关系
- 支持时间属性
- 自动合并重复实体
- 实体消歧(用户辅助确认合并)
- 图谱增量构建
- 节点可视化布局
- 实体颜色/形状区分类型
- 边可显示关系名称与方向
- 拖动、缩放、搜索实体
- 节点详情查看
- 子图聚焦
- 节点路径探索
- 支持自然语言问答
- 系统返回结构化答案 + 子图高亮
| 类型 |
描述 |
| 性能 |
单文件处理 ≤ 30 秒,图谱支持 1000+ 节点 |
| 安全性 |
用户权限隔离,支持私有部署 |
| 扩展性 |
支持多模态模块接入 |
| 响应速度 |
页面加载 ≤ 3 秒,交互延迟 ≤ 100ms |
| 可部署性 |
支持本地或服务器部署,提供 Docker 支持 |
- Web 系统代码
- 图谱数据库结构初始化脚本
- 抽取模块配置说明
- 系统部署文档
- 用户使用手册
- 样例数据
| 阶段 |
功能范围 |
工期建议 |
| 第一阶段 |
文本抽取 + 图谱构建 + 可视化 |
3~4 周 |
| 第二阶段 |
图像抽取 + 多模态融合 + 高级交互 |
3~4 周 |
| 第三阶段 |
视频抽取 + 智能问答 + 路径分析 |
2~3 周 |