MCPcopy
hub / github.com/Imbad0202/academic-research-skills

github.com/Imbad0202/academic-research-skills @v3.14.0 sqlite

repository ↗ · DeepWiki ↗ · release v3.14.0 ↗
4,461 symbols 14,105 edges 222 files 1,848 documented · 41%
README

Claude Code를 위한 Academic Research Skills

Version DOI License: CC BY-NC 4.0 Sponsor

English | 简体中文版 | 繁體中文版 | 日本語版

학술 연구를 위한 Claude Code 통합 스킬 모음으로, 연구 설계부터 논문 작성·검토·출판 준비까지의 전체 워크플로를 지원합니다.

30초 만에 설치(Claude Code CLI / VS Code / JetBrains, v3.7.0+):

/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills

그런 다음 /ars-plan을 실행해 소크라테스식 대화로 논문 구조를 짜보거나, 사전 요건과 전통적인 심볼릭 링크 방식을 보려면 빠른 설치로 이동하세요.

AI는 부조종사이지 조종사가 아닙니다. 이 도구는 논문을 대신 써 주지 않습니다. 참고문헌 탐색, 인용 형식 정리, 데이터 검증, 논리적 일관성 점검과 같은 반복적이고 소모적인 작업을 지원하여, 실제로 사람의 판단이 필요한 부분 — 질문 정의, 방법 선택, 데이터가 의미하는 바의 해석, 그리고 "나는 ~라고 주장한다" 다음에 오는 문장을 쓰는 일 — 에 집중할 수 있게 합니다.

휴머나이저(humanizer)와 달리, 이 도구는 AI를 사용했다는 사실을 숨기도록 돕지 않습니다. 더 잘 쓰도록 돕습니다. Style Calibration은 과거 작업에서 사용자의 문체를 학습합니다. Writing Quality Check는 기계가 생성한 듯한 느낌을 주는 패턴을 잡아냅니다. 목표는 품질이지 부정행위가 아닙니다.

왜 완전 자동화가 아니라 인간 참여형(human-in-the-loop)인가?

Lu et al. (2026, Nature 651:914-919)은 The AI Scientist를 만들었습니다 — 최상위 ML 학회의 블라인드 동료 심사를 통과해 논문을 게재한 최초의 완전 자율 AI 연구 시스템입니다(ICLR 2025 workshop, 점수 6.33/10 vs workshop 평균 4.87). 이들의 Limitations 절은 완전 자율 AI 연구 파이프라인이 물려받는 실패 양상을 열거합니다: 구현 버그, 환각된 결과, 지름길 의존, 버그를 통찰로 재포장, 방법론 날조, 프레임 고착, 인용 환각.

ARS는 AI의 지원을 받는 인간 연구자가 인간이나 AI가 단독으로 연구할 때보다 이러한 실패 양상을 더 효과적으로 줄일 수 있다는 전제에서 설계되었습니다. Stage 2.5와 Stage 4.5 무결성 게이트는 7개 모드의 차단형 체크리스트를 실행합니다. 자세한 내용은 academic-pipeline/references/ai_research_failure_modes.md를 참조하세요. 또한 리뷰어는 사용자가 제공한 골드셋에 대해 자신의 FNR/FPR을 측정하는 옵트인 calibration 모드를 제공합니다.

Zhao et al. (2026-05)은 arXiv, bioRxiv, SSRN, PMC의 250만 편 논문에 걸친 1억 1,100만 건의 참고문헌을 대규모로 점검했습니다. 이들의 보수적 추정치는 2025년 한 해에만 146,932건의 환각된 인용이며, 2024년 중반에 변곡점이 관찰되었습니다. bioRxiv-to-PMC 쌍에 대해서는 85.3%의 preprint-to-published 지속성을 보고합니다. 이 논문은 "인용된 참고문헌이 실제로는 뒷받침하지 않는 주장을 지지하기 위해 배치된 진짜 인용"을 미해결 과제로 기술합니다. ARS v3.7.1은 출처 provenance를 위한 trust-chain frontmatter를 추가했고, v3.7.3은 향후 주장 수준 감사를 위한 locator 인프라(3계층 인용 앵커)를 추가하고 인용 시점에 참고용 위험 신호를 표시합니다(ARS는 이 주장-충실성 격차를 내부적으로 "L3"로 라벨링합니다. 이는 ARS 용어이며 논문의 용어가 아닙니다). v3.7.x는 Zhao et al.의 코퍼스 규모 발견에 동기를 두며, ARS 자체에 대한 코퍼스 규모 평가는 향후 과제로 남아 있습니다.

v3.8은 L3 격차의 나머지 절반을 메웁니다. v3.7.3은 모든 인용이 locator 앵커를 갖도록 했고, v3.8은 각 앵커에 대해 인용된 출처를 가져와 주장이 실제로 뒷받침되는지 판단하는 옵트인 감사 패스(ARS_CLAIM_AUDIT=1)를 추가합니다. 다섯 개의 새로운 HIGH-WARN 클래스(claim-not-supported, negative-constraint-violation, fabricated-reference, anchorless, constraint-violation-uncited)의 출력을 formatter terminal hard gate가 거부합니다. 캘리브레이션은 FNR<0.15 + FPR<0.10 합격 임계값을 갖는 20개 항목으로 구성된 골드셋으로 제공됩니다. 단계적 활성화 계획은 v3.8 명세 §5에 따라 캘리브레이션 후 증거가 나올 때까지 보류됩니다.

v3.3은 PaperOrchestra (Song, Song, Pfister & Yoon, 2026, Google)에서 영감을 받았습니다: Semantic Scholar API 검증, anti-leakage 프로토콜, VLM 그림 검증, 점수 궤적 추적.


아키텍처 & 파이프라인

👉 docs/ARCHITECTURE.md — 전체 파이프라인 개요: 흐름도, 단계별 매트릭스, 데이터 접근 흐름, 스킬 의존성 그래프, 품질 게이트, 모드 목록.

아키텍처 문서는 기존의 상세한 파이프라인 설명을 대체합니다. 어떤 단계에서 무엇이 실행되는지에 관한 모든 내용이 이제 한 곳에 있습니다.

빠른 설치

사전 요건

  • Claude Code (최신 버전. 플러그인 패키징은 최근 버전을 요구합니다)
  • ANTHROPIC_API_KEY를 export하거나, 첫 claude 실행 시 설정
  • 선택: DOCX용 Pandoc, APA 7.0 PDF용 tectonic + Source Han Serif TC (Markdown 출력은 둘 다 없어도 동작)
  • 선택(실제 Python): 핵심 스킬(research / write / review)은 Python이 필요 없습니다 — 프롬프트 기반입니다. 실제 Python 인터프리터는 다음에만 필요합니다: PreToolUse write-scope guard(선택적 서브에이전트 하드닝 — 실제 Python을 찾지 못하면 오류 없이 no-op으로 처리되고 guard는 비활성화됩니다. 핵심 스킬은 영향받지 않습니다), 그리고 Python 프로세스를 호출하는 몇 가지 옵트인 기능(revision-patch 모드, submission-package verifier, /ars-cache-invalidate / /ars-mark-read / /ars-unmark-read 명령). Windows에서는 python3가 실제 Python이 아니라 동작하지 않는 Microsoft Store placeholder인 경우가 많으니, 런처가 실제 인터프리터를 찾을 수 있도록 python.org에서(또는 winget으로) Python을 설치하세요. guard 런처는 POSIX 셸 스크립트이고 hooks.json이 이를 bash로 호출하므로, Windows에서는 Git Bash(Git for Windows에 번들됨)가 필요합니다. Git Bash가 있으면 실제 Python이 없어도 오류 없이 기능이 비활성화됩니다(guard는 조용히 no-op으로 처리됩니다). Git Bash가 없으면 Claude Code는 PowerShell로 폴백하는데, PowerShell은 .sh 런처를 전혀 실행할 수 없습니다: guard는 비활성화되고 PreToolUse 훅은 호출마다 조용히 no-op하는 대신 오류를 로깅합니다(허용된 기능 저하 — guard는 선택적이며 절대 쓰기를 막지 않지만, Git Bash 설치 전까지는 훅 오류 로그가 발생할 수 있습니다).

플러그인 설치(v3.7.0+, 권장):

/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills

동작 확인: /ars-plan을 실행하고 작업 중인 논문을 설명하세요 — ARS가 소크라테스식 대화를 시작해 논문의 장 구조를 함께 그려 줍니다. 단발성 테스트를 원하면 /ars-lit-review "your topic"을 시도하세요.

👉 docs/SETUP.md — 전체 가이드: Claude Code 설치, API 키 설정, DOCX/PDF용 선택적 Pandoc/tectonic, 교차 모델 검증(ARS_CROSS_MODEL), 여섯 가지 설치 방법(Plugin, project skills, global skills, claude.ai Project, repo-cloned, Claude Science 가져오기).

Claude Science를 사용하시나요? 네 개의 스킬을 바로 가져올 수 있습니다: Skills → Import from GitHub에서 https://github.com/Imbad0202/academic-research-skills를 붙여넣고 PreviewImport 4 skills(이 저장소 v3.14.0+ 필요 — 가져오기 도구는 marketplace manifest에 명시된 스킬 경로를 읽습니다). 가져오기는 특정 시점의 스냅샷입니다: ARS 업데이트 후에는 다시 가져오세요. 가져온 스킬은 ARS 방법론(연구/작성/리뷰 프로토콜)을 담습니다. Claude Code 전용 메커니즘 — slash commands, hooks, 서브에이전트 오케스트레이션 — 은 이전되지 않습니다. 자세한 내용은 docs/SETUP.md Method 5를 참조하세요.

Codex CLI를 사용하시나요? 대신 자매 배포판을 설치하세요: Imbad0202/academic-research-skills-codex — 동일한 워크플로 콘텐츠를, ars-* 별칭을 갖는 단일 $academic-research-suite 스킬로 Codex 네이티브 패키징한 것입니다.

성능 & 비용

👉 docs/PERFORMANCE.md — 모드별 토큰 예산, 전체 파이프라인 추정치(15,000 단어 논문 기준 약 $4–6), 권장 Claude Code 설정(Auto 모드. Agent Team 선택).

가이드 & 글


한눈에 보는 기능

  • Deep Research — 소크라테스식 가이드 모드, PRISMA 체계적 문헌고찰, 의도 감지, 대화 건강도 모니터링, 선택적 교차 모델 DA, Semantic Scholar API 검증을 갖춘 13개 에이전트 연구팀.
  • Academic Paper — Style Calibration, Writing Quality Check, LaTeX 하드닝, 시각화, 수정 코칭, 인용 변환, anti-leakage 프로토콜, VLM 그림 검증을 갖춘 12개 에이전트 논문 작성.
  • Academic Paper Reviewer — 0–100 품질 루브릭(EIC + 동적 리뷰어 3명 + Devil's Advocate), 양보 임계값 프로토콜, 공격 강도 보존, 선택적 교차 모델 DA 비평 / 캘리브레이션, R&R 추적 매트릭스, 읽기 전용 제약을 갖춘 7개 에이전트 다관점 동료 심사.
  • Academic Pipeline — 적응형 체크포인트, 주장 검증, Material Passport, 선택적 repro_lock, 선택적 교차 모델 무결성 검증, 대화 중 강화, 점수 궤적 추적을 갖춘 10단계 파이프라인 오케스트레이터.
  • Data Access Level Metadata (v3.3.2+) — 모든 스킬이 data_access_level(raw / redacted / verified_only)을 선언하며, scripts/check_data_access_level.py로 강제됩니다. Anthropic의 automated-w2s-researcher (2026)에서 패턴을 차용했습니다. 자세한 내용은 shared/ground_truth_isolation_pattern.md를 참조하세요.
  • Task Type Annotation (v3.3.2+) — 모든 스킬이 task_type(open-ended 또는 outcome-gradable)을 선언합니다. 현재 모든 ARS 스킬은 open-ended입니다.
  • Benchmark Report Schema (v3.3.5+) — 정직한 벤치마크 비교를 위한 JSON Schema와 린트입니다. 자세한 내용은 shared/benchmark_report_pattern.md를 참조하세요.
  • Artifact Reproducibility Lockfile (v3.3.5+) — Material Passport의 선택적 repro_lock 하위 블록. 재현 보장이 아니라 구성 문서화입니다 — LLM 출력은 바이트 단위로 재현 가능하지 않습니다. 자세한 내용은 shared/artifact_reproducibility_pattern.md를 참조하세요.
  • Experiment Provenance Intake (#260) — Material Passport의 선택적 experiment_provenance[]는 연구자가 외부에서 실행한 실험을 기록하며(ARS는 절대 실험을 실행하지 않습니다), 원고의 주장은 claim_intent_manifest.planned_experiment_ids[]를 통해 이에 연결됩니다. 무결성 게이트(Stage 2.5/4.5)는 실험 기반 각 주장을 선언된 provenance와 대조해 검증합니다 — ALIGNED / OVERSTATED / NOT_SUPPORTED_BY_PROVENANCE / PROVENANCE_INSUFFICIENT실험 자체가 옳았는지는 판단하지 않습니다. fail-closed experiment_intake_declaration은 "실험을 실행했는가?"를 명시적인 Stage 1 결정으로 만듭니다(문헌 전용 실행조차 no_experiments_declared를 선언). 자세한 내용은 shared/handoff_schemas.md의 §"Experiment Provenance Intake (#260)"를 참조하세요.

쇼케이스: 실제 파이프라인 출력

실제 10단계 파이프라인 실행에서 나온 완전한 산출물 — 동료 심사 보고서, 무결성 검증 보고서, 최종 논문 — 을 확인하세요:

모든 파이프라인 산출물 둘러보기 →

산출물 설명
Final Paper (EN) APA 7.0 형식, LaTeX 컴파일
Final Paper (ZH) 중국어 버전, APA 7.0
Integrity Report — Pre-Review Stage 2.5: 날조된 참고문헌 15건 + 통계 오류 3건 적발
Integrity Report — Final Stage 4.5: 회귀 없음 확인
Peer Review Round 1 EIC + 리뷰어 3명 + Devil's Advocate
Re-Review 수정 후 검증
Peer Review Round 2 후속 심사
Response to Reviewers 항목별 저자 응답
Post-Publication Audit Report 독립적 전체 참고문헌 감사: 3회의 무결성 점검이 놓친 21/68 문제 발견

동반 도구: Experiment Agent

연구가 글쓰기 전에 실험(코드 또는 인간 대상 연구)을 수행해야 한다면, Experiment Agent 스킬이 ARS Stage 1(RESEARCH)과 Stage 2(WRITE) 사이의 공백을 메웁니다.

ARS Stage 1 RESEARCH  →  RQ Brief + Methodology Blueprint
        ↓
  experiment-agent     →  run/manage experiments → validate results
        ↓
ARS Stage 2 WRITE     →  write paper with verified experiment results

무엇을 하는가: 실시간 모니터링과 함께 코드 실험(Python, R 등)을 실행하고, IRB 윤리 체크리스트로 인간 대상 연구 프로토콜을 관리하며, 11종 오류(fallacy) 감지로 통계를 해석하고, 재현성을 검증합니다.

함께 사용하는 방법: Stage 1 이후 ARS 파이프라인을 일시 중지하고, 별도의 experiment-agent 세션에서 실험을 실행한 다음, 결과를(Material Passport와 함께) ARS Stage 2로 다시 가져옵니다. ARS는 어떤 수정도 필요하지 않습니다. 설정 방법은 experiment-agent README를 참고하세요.

Stage 1 intake 선언 (#260): Stage 1에서 ARS는 해당 실행이 실험 기반 주장을 포함할지 감지하고 Material Passport에 fail-closed experiment_intake_declaration을 설정합니다. 외부에서 실험을 실행했다면 연구자는 실험당 하나의 experiment_provenance[] 항목(experiment_id, 중첩된 repro_lock, planned_vs_executed[], negative_results[], known_limitations[])을 입력하고 선언은 experiments_declared로 설정됩니다. 그렇지 않으면 no_experiments_declared로 설정됩니다. 이 선언은 #260 이후 모든 passport에서 필수입니다 — 실험을 전혀 다루지 않는 실행도 no_experiments_declared를 선언하므로, 잊힌 provenance 블록 때문에 무결성 게이트가 조용히 우회될 수 없습니다. experiment_id는 이 intake 시점에 고정되며, 작성자는 이후 planned_experiment_ids[]를 통해 이를 참조합니다.

교육 측 동반 도구: Teaching Skills는 ARS 아키텍처(스킬 앙상블, 공유 계약, 단계별 게이트, Course Passport)를 학술 생활의 교육 측면에 적용합니다 — 강좌 설계 → 수업 → 평가 → 전달 → 성찰. 이것의 sotl 모드는 수업 탐구 프로젝트를 출판 단계를 위해 ARS deep-research / academic-paper로 넘깁니다.


사용법

빠른 시작

# 전체 연구 파이프라인 시작
You: "I want to write a research paper on AI's impact on higher education QA"

# 소크라테스식 가이던스로 시작
You: "Guide my research on AI in educational evaluation"

# 가이드된 플래닝으로 논문 작성
You: "Guide me through writing a paper on demographic decline"

# 기존 논문 검토
You: "Review this paper" (그런 다음 논문을 제공)

# 파이프라인 상태 확인
You: "status"

개별 스킬

Deep Research (8개 모드)

"Research the impact of AI on higher education"       → full 모드
"Give me a quick brief on X"                          → quick 모드
"Do a systematic review on X with PRISMA"             → systematic-review 모드
"Guide my research on X"                              → socratic 모드 (guided)
"Fact-check these claims"                             → fact-check 모드
"Do a literature review on X"                         → lit-review 모드
"Compare these papers in WHY/HOW/WHAT format"         → three-way-scan 모드
"Review this paper's research quality"                → review 모드

Academic Paper (11개 모드)

"Write a paper on X"                                  → full 모드
"Guide me through writing a paper"                    → plan 모드 (guided)
"Build a paper outline"                               → outline-only 모드
"I have a draft, here are reviewer comments"          → revision 모드
"Parse these reviewer comments into a roadmap"        → revision-coach 모드
"Write an abstract for this paper"                    → abstract-only 모드
"Turn this into a literature review paper"            → lit-review 모드
"Convert to LaTeX" / "Convert citations to IEEE"      → format-convert 모드
"Check citations"                                     → citation-check 모드
"Generate an AI disclosure statement for NeurIPS"     → disclosure 모드
"Audit my rebuttal draft against the reviews"         → rebuttal-audit 모드

Academic Paper Reviewer (6개 모드)

"Review this paper"                                   → full 모드 (EIC + R1/R2/R3 + Devil's Advocate)
"Quick assessment of this paper"                      → quick 모드
"Guide me to improve this paper"                      → guided 모드
"Check the methodology"                               → methodology-focus 모드
"Verify the revisions"                                → re-review 모드
"Calibrate this reviewer against my gold set"         → calibration 모드

Academic Pipeline (오케스트레이터)

"I want to write a complete research paper"           → Stage 1부터 full 파이프라인
"I already have a paper, review it"                   → Stage 2.5 중간 진입 (무결성 먼저)
"I received reviewer comments"                        → Stage 4 중간 진입

파이프라인은 Stage 6: Process Summary로 끝납니다 — 6차원 협업 품질 평가(

Core symbols most depended-on inside this repo

get
called by 1211
scripts/verification_cache.py
expect_contains
called by 134
scripts/check_spec_consistency.py
run
called by 78
scripts/check_v3_6_7_pattern_protection.py
parse_document
called by 49
scripts/_block_parser.py
lint_file
called by 49
scripts/check_v3_7_3_three_layer_citation.py
validate
called by 43
scripts/check_sprint_contract.py
_check
called by 38
scripts/verify_submission_package.py
lookup
called by 37
scripts/contamination_signals.py

Shape

Function 2,354
Method 1,707
Class 397
Route 3

Languages

Python100%

Modules by API surface

scripts/test_check_audit_artifact_consistency.py177 symbols
scripts/test_claim_audit_pipeline.py149 symbols
scripts/test_claim_audit_schema.py141 symbols
scripts/test_contamination_signals.py99 symbols
scripts/test_verify_submission_package.py95 symbols
scripts/test_check_v3_6_7_pattern_protection.py85 symbols
scripts/test_check_sprint_contract.py84 symbols
scripts/test_ars_write_scope_guard.py81 symbols
scripts/test_policy_anchor_disclosure.py76 symbols
scripts/test_experiment_provenance.py75 symbols
scripts/verify_submission_package.py64 symbols
scripts/check_audit_artifact_consistency.py59 symbols

Dependencies from manifests, versioned

ruamel.yaml0.17 · 1×

For agents

$ claude mcp add academic-research-skills \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact