阿里巴巴推出智能简历解析神器 - SmartResume,解放HR?
阿里巴巴研究团队推出简历解析AI神器SmartResume,其核心是基于布局感知的统一解析框架,将多格式简历转化为结构化信息,兼顾高精度与高效能。该框架直击简历格式多样、大模型成本高、响应慢的痛点,在准确率与效率上实现突破。
SmartResume先通过“布局感知解析器”识别简历逻辑区块并有序重组,再对仅0.6B参数的Qwen3模型微调,结合并行任务分解与索引指针机制,既保证信息不失真,又大幅提升速度。实验显示,其在RealResume数据集上F1-score达0.964,处理单份简历平均耗时1.54秒,较Claude-4快3-4倍。
支持PDF、图片、常见Office格式简历输入,通过OCR+PDF元数据提取文本。
基于布局检测重构阅读顺序,借助LLM提取基础信息、教育经历、工作经验等结构化字段。
提供CLI和Python API两种使用方式,支持本地模型部署(vLLM)。
部署与使用要求。
环境依赖。Python≥3.9、内存≥8GB、存储≥10GB,CUDA≥11.0(可选,GPU加速)。
安装流程。克隆仓库→创建conda环境→安装依赖→配置API密钥(或下载本地模型)。
- git clone https://github.com/alibaba/SmartResume.git
cd SmartResume;
- 创建conda环境
conda create -n resume_parsing python=3.9
conda activate resume_parsing;
- 安装依赖
pip install -e .;
- 配置环境
Copy configuration template
cp configs/config.yaml.example configs/config.yaml
Edit configuration file and add API keys
vim configs/config.yaml
限制说明。因开源合规,原内部PDF解析和OCR组件已替换为开源替代方案,部分功能可能与原生版本不兼容。
目前该技术已部署于阿里内部HR系统,每分钟可处理240-300份简历,10秒内解析成功率非常高。相关论文、代码及Demo已在GitHub、HuggingFace等平台公开。
GitHub地址:https://github.com/alibaba/SmartResume
Demo地址:https://modelscope.cn/studios/Alibaba-EI/SmartResumeDemo
ModelScope地址:https://modelscope.cn/models/Alibaba-EI/SmartResume
HuggingFace地址:https://huggingface.co/Alibaba-EI/SmartResume
论文地址:https://arxiv.org/abs/2510.09722
