test/skills/aminer-open-academic/SKILL.md
2026-03-24 04:04:58 +00:00

12 KiB
Executable File
Raw Blame History

name description
aminer-data-search 使用 AMiner 开放平台 API 进行学术数据查询与分析。当用户需要查询学者信息、论文详情、机构数据、期刊内容或专利信息时使用此 skill。 触发场景:提到 AMiner、学术数据查询、查论文/学者/机构/期刊/专利、学术问答搜索、引用分析、科研机构分析、学者画像、论文引用链、期刊投稿分析等。 支持 6 大组合工作流(学者全景分析、论文深度挖掘、机构研究力分析、期刊论文监控、学术智能问答、专利链分析)以及 28 个独立 API 的直接调用。 即使用户只说"帮我查一下 XXX 学者"或"找找关于 XXX 的论文",也应主动使用此 skill。

AMiner 开放平台学术数据查询

AMiner 是全球领先的学术数据平台,提供学者、论文、机构、期刊、专利等全维度学术数据。 本 skill 涵盖全部 28 个开放 API并将它们组合成 6 大实用工作流。


第一步:获取 Token

所有 API 调用需要在请求头中携带 Authorization: <your_token>

获取方式:

  1. 前往 AMiner 控制台 登录并生成 API Token
  2. 若不了解如何操作,请参阅 开放平台文档

Token 请前往 控制台 登录后生成,有效期内可重复使用。


快速使用Python 脚本)

所有工作流均可通过 scripts/aminer_client.py 驱动:

# 学者全景分析
python scripts/aminer_client.py --token <TOKEN> --action scholar_profile --name "Andrew Ng"

# 论文深度挖掘(含引用链)
python scripts/aminer_client.py --token <TOKEN> --action paper_deep_dive --title "Attention is all you need"

# 机构研究力分析
python scripts/aminer_client.py --token <TOKEN> --action org_analysis --org "清华大学"

# 期刊论文监控(指定年份)
python scripts/aminer_client.py --token <TOKEN> --action venue_papers --venue "Nature" --year 2024

# 学术智能问答(自然语言提问)
python scripts/aminer_client.py --token <TOKEN> --action paper_qa --query "transformer架构最新进展"

# 专利搜索与详情
python scripts/aminer_client.py --token <TOKEN> --action patent_search --query "量子计算"

也可以直接调用单个 API

python scripts/aminer_client.py --token <TOKEN> --action raw \
  --api paper_search --params '{"title": "BERT", "page": 0, "size": 5}'

稳定性与失败处理策略(必读)

客户端 scripts/aminer_client.py 内置了请求重试与降级策略,用于减少网络抖动和短暂服务异常对结果的影响。

  • 超时与重试
    • 默认请求超时:30s
    • 最大重试次数:3
    • 退避策略:指数退避(1s -> 2s -> 4s+ 随机抖动
  • 可重试状态码
    • 408 / 429 / 500 / 502 / 503 / 504
  • 不可重试场景
    • 常见 4xx(如参数错误、鉴权问题)默认不重试,直接返回错误结构
  • 工作流降级
    • paper_deep_divepaper_search 无结果时自动降级到 paper_search_pro
    • paper_qaquery 模式无结果时,自动降级到 paper_search_pro
  • 可追踪调用链
    • 组合工作流输出中包含 source_api_chain,用于标记结果由哪些 API 组合得到

论文搜索接口选型指南

当用户说“查论文”时,先判断目标是“找 ID”、“做筛选”、“做问答”还是“做分析报表”再选 API

API 侧重点 适用场景 成本
paper_search 标题检索、快速拿 paper_id 已知论文标题,先定位目标论文 免费
paper_search_pro 多条件检索与排序(作者/机构/期刊/关键词) 主题检索、按引用量或年份排序 ¥0.01/次
paper_qa_search 自然语言问答/主题词检索 用户用自然语言描述需求,先走语义检索 ¥0.05/次
paper_list_by_search_venue 返回更完整论文信息(适合分析) 需要更丰富字段做分析/报告 ¥0.30/次
paper_list_by_keywords 多关键词批量检索 批量专题拉取(如 AlphaFold + protein folding ¥0.10/次
paper_detail_by_condition 年份+期刊维度拉详情 期刊年度监控、选刊分析 ¥0.20/次

推荐路由(默认):

  1. 已知标题paper_search -> paper_detail -> paper_relation
  2. 条件筛选paper_search_pro -> paper_detail
  3. 自然语言问答paper_qa_search(若无结果降级 paper_search_pro
  4. 期刊年度分析venue_search -> venue_paper_relation -> paper_detail_by_condition

6 大组合工作流

工作流 1学者全景分析Scholar Profile

适用场景:了解某位学者的完整学术画像,包括简介、研究方向、发表论文、专利、科研项目。

调用链:

学者搜索name → person_id
    ↓
并行调用:
  ├── 学者详情bio/教育背景/荣誉)
  ├── 学者画像(研究方向/兴趣/工作经历)
  ├── 学者论文(论文列表)
  ├── 学者专利(专利列表)
  └── 学者项目(科研项目/资助信息)

命令:

python scripts/aminer_client.py --token <TOKEN> --action scholar_profile --name "Yann LeCun"

输出示例字段:

  • 基本信息:姓名、机构、职称、性别
  • 个人简介(中英文)
  • 研究兴趣与领域
  • 教育背景(结构化)
  • 工作经历(结构化)
  • 论文列表ID + 标题)
  • 专利列表ID + 标题)
  • 科研项目(标题/资助金额/时间)

工作流 2论文深度挖掘Paper Deep Dive

适用场景:根据论文标题或关键词,获取论文完整信息及引用关系。

调用链:

论文搜索 / 论文搜索protitle/keyword → paper_id
    ↓
论文详情(摘要/作者/DOI/期刊/年份/关键词)
    ↓
论文引用(该论文引用了哪些论文 → cited_ids
    ↓
(可选)对被引论文批量获取论文信息

命令:

# 按标题搜索
python scripts/aminer_client.py --token <TOKEN> --action paper_deep_dive --title "BERT"

# 按关键词搜索(使用 pro 接口)
python scripts/aminer_client.py --token <TOKEN> --action paper_deep_dive \
  --keyword "large language model" --author "Hinton" --order n_citation

工作流 3机构研究力分析Org Analysis

适用场景:分析某机构的学者规模、论文产出、专利数量,适合竞品研究或合作评估。

调用链:

机构消歧pro原始字符串 → org_id处理别名/全称差异)
    ↓
并行调用:
  ├── 机构详情(简介/类型/成立时间)
  ├── 机构学者(学者列表)
  ├── 机构论文(论文列表)
  └── 机构专利专利ID列表支持分页最多10000条

若有多个同名机构,机构搜索会返回候选列表,可结合机构消歧 pro 精确匹配。

命令:

python scripts/aminer_client.py --token <TOKEN> --action org_analysis --org "MIT"
# 指定原始字符串(含缩写/别名)
python scripts/aminer_client.py --token <TOKEN> --action org_analysis --org "Massachusetts Institute of Technology, CSAIL"

工作流 4期刊论文监控Venue Papers

适用场景:追踪某期刊特定年份的论文,用于投稿调研或研究热点分析。

调用链:

期刊搜索name → venue_id
    ↓
期刊详情ISSN/类型/简称)
    ↓
期刊论文venue_id + year → paper_id 列表)
    ↓
(可选)论文详情批量查询

命令:

python scripts/aminer_client.py --token <TOKEN> --action venue_papers --venue "NeurIPS" --year 2023

适用场景:用自然语言或结构化关键词智能搜索论文,支持 SCI 过滤、引用量排序、作者/机构限定。

核心 API论文问答搜索¥0.05/次),支持:

  • query:自然语言提问,系统自动拆解为关键词
  • topic_high/middle/low:精细控制关键词权重(嵌套数组 OR/AND 逻辑)
  • sci_flag:只看 SCI 论文
  • force_citation_sort:按引用量排序
  • author_terms / org_terms:限定作者或机构

命令:

# 自然语言问答
python scripts/aminer_client.py --token <TOKEN> --action paper_qa \
  --query "用于蛋白质结构预测的深度学习方法"

# 精细关键词搜索(必须同时含 A 和 B加分含 C
python scripts/aminer_client.py --token <TOKEN> --action paper_qa \
  --topic_high '[["transformer","self-attention"],["protein folding"]]' \
  --topic_middle '[["AlphaFold"]]' \
  --sci_flag --sort_citation

工作流 6专利链分析Patent Analysis

适用场景:搜索特定技术领域的专利,或获取某学者/机构的专利组合。

调用链(独立搜索):

专利搜索query → patent_id
    ↓
专利详情(摘要/申请日/申请号/受让人/发明人)

调用链(经由学者/机构):

学者搜索 → 学者专利patent_id 列表)
机构消歧 → 机构专利patent_id 列表)
    ↓
专利信息 / 专利详情

命令:

python scripts/aminer_client.py --token <TOKEN> --action patent_search --query "量子计算芯片"
python scripts/aminer_client.py --token <TOKEN> --action scholar_patents --name "张首晟"

单独 API 速查表

完整参数说明请阅读 references/api-catalog.md

# 标题 方法 价格 接口路径基础域名datacenter.aminer.cn/gateway/open_platform
1 论文问答搜索 POST ¥0.05 /api/paper/qa/search
2 学者搜索 POST 免费 /api/person/search
3 论文搜索 GET 免费 /api/paper/search
4 论文搜索pro GET ¥0.01 /api/paper/search/pro
5 专利搜索 POST 免费 /api/patent/search
6 机构搜索 POST 免费 /api/organization/search
7 期刊搜索 POST 免费 /api/venue/search
8 学者详情 GET ¥1.00 /api/person/detail
9 学者项目 GET ¥3.00 /api/project/person/v3/open
10 学者论文 GET ¥1.50 /api/person/paper/relation
11 学者专利 GET ¥1.50 /api/person/patent/relation
12 学者画像 GET ¥0.50 /api/person/figure
13 论文信息 POST 免费 /api/paper/info
14 论文详情 GET ¥0.01 /api/paper/detail
15 论文引用 GET ¥0.10 /api/paper/relation
16 专利信息 GET 免费 /api/patent/info
17 专利详情 GET ¥0.01 /api/patent/detail
18 机构详情 POST ¥0.01 /api/organization/detail
19 机构专利 GET ¥0.10 /api/organization/patent/relation
20 机构学者 GET ¥0.50 /api/organization/person/relation
21 机构论文 GET ¥0.10 /api/organization/paper/relation
22 期刊详情 POST ¥0.20 /api/venue/detail
23 期刊论文 POST ¥0.10 /api/venue/paper/relation
24 机构消歧 POST ¥0.01 /api/organization/na
25 机构消歧pro POST ¥0.05 /api/organization/na/pro
26 论文搜索接口 GET ¥0.30 /api/paper/list/by/search/venue
27 论文批量查询 GET ¥0.10 /api/paper/list/citation/by/keywords
28 按年份与期刊获取论文详情 GET ¥0.20 /api/paper/platform/allpubs/more/detail/by/ts/org/venue

参考资料