hub / github.com/TencentCloudADP/youtu-agent

github.com/TencentCloudADP/youtu-agent @v0.1.3 sqlite

repository ↗ · DeepWiki ↗ · release v0.1.3 ↗

1,371 symbols 5,721 edges 284 files 347 documented · 25%

README

Youtu-Agent：シンプルで強力なエージェントフレームワーク

Youtu-Agentは、自律エージェントを構築・実行・評価するための柔軟で高性能なフレームワークです。ベンチマークテストでトップクラスの成績を収めるだけでなく、オープンソースモデルを活用してデータ分析、ファイル処理、深層学習などの高度な機能を実現できる強力なエージェント機能も備えています。

Youtu-agent Logo

主なハイライト： - パフォーマンスの検証：WebWalkerQAではpass@1で71.47%、GAIA（純テキストサブセット）ではpass@1で72.8%を達成しました。これはDeepSeek-V3シリーズのモデルのみを使用しており（ClaudeやGPTは使用していません）、強力なオープンソースの出発点を築きました。 - オープンソースに優しく、コストに敏感：アクセスしやすく、低コストでのデプロイを最適化しており、クローズドなモデルに依存しません。 - 実際の使用例：CSV分析、文献レビュー、個人ファイルの整理、ポッドキャストやビデオの生成などのタスクを箱から出してすぐにサポートします。（近日公開予定） - 柔軟なアーキテクチャ：openai-agentsに基づいて構築されており、DeepSeekからgpt-ossまでのさまざまなモデルAPI、ツールの統合、フレームワークの実装と互換性があります。 - 自動化とシンプルさ：YAMLベースの設定、自動エージェント生成、簡素化された設定により、手動の作業負担が減ります。

🗞️ ニュース

🚀 [2025-10-10] Training-Free Group Relative Policy Optimization。DeepSeek-V3.2 のRLが8ドルで？本当に実現しました！トレーニング不要の GRPO が DeepSeek-V3.2 を凍結したまま約100件のサンプルからトークン事前分布を学習し、RL のコストをおよそ8ドルまで抑えつつ数学とウェブ検索タスクで改善を確認しました！コードブランチ training_free_GRPO [X ポスト]。
🛠️ [2025-09-28] エージェント自動生成に加えて、要件を一度伝えるだけでYoutu-Agentがツールを構築してくれる自動ツール生成機能をリリースしました。[詳細]。
📺 [2025-09-09] 「Youtu-Agent」の設計思想と基本的な使い方についてライブ配信を行いました。[動画] [資料]。
🎁 [2025-09-02] テンセントクラウド国際サイトでは、DeepSeek APIの新規ユーザーに対して300万枚の無料トークンを提供しています（2025年9月1日から2025年10月31日まで）。Youtu-AgentでDeepSeekモデルを使用したい場合は、無料トライアルをクリックしてください！企業向けのエージェントソリューションについては、エージェント開発プラットフォームADPもご覧ください。
📺 [2025-08-28] 新しくリリースされたDeepSeek-V3.1モデルについてライブ配信を行い、Youtu-Agentフレームワークでの使用方法を紹介しました。[動画] [資料]。

🌟 ベンチマークパフォーマンス

Youtu-Agentはオープンソースモデルと軽量なツールをベースに構築されており、チャレンジングなディープサーチやツール使用のベンチマークテストで優れたパフォーマンスを発揮しています。

WebWalkerQA：DeepSeek-V3-0324を使用して60.71%の精度を達成し、新しくリリースされたDeepSeek-V3.1を使用すると71.47%に向上し、新たなSOTA（State of the Art）のパフォーマンスを記録しました。
GAIA：DeepSeek-V3-0324（ツールで使用されているモデルを含む）を使用して、純テキスト検証サブセットでpass@1で72.8%を達成しました。多モーダルツールを含む完全なGAIAベンチマークの評価を積極的に拡大しており、近日中に完全なトレースを公開予定ですので、ご期待ください！✨

WebWalkerQA

💡 使用例

データ分析 CSVファイルを分析し、HTMLレポートを生成します。	ファイル管理ユーザーのためにローカルファイルの名前を変更したり分類したりします。
広範な研究大量の情報を収集して総合的なレポートを作成し、Manusの機能を再現します。	論文分析指定された論文を解析し、分析を行い、関連する文献を整理して最終結果を出します。

[!NOTE] 詳細については、examplesディレクトリとドキュメントを参照してください。

🤖 自動ツール＆エージェント生成

Youtu-Agentの大きな特長は、エージェント設定だけでなくツールも自動生成できる点です。他のフレームワークでは、エージェントを動かす前に関数を実装したりプロンプトを細かく設計したりする必要がありますが、Youtu-Agentではタスクを説明するだけで済みます。内蔵のメタエージェントが対話を通じて要件を整理し、必要なツールを組み立て、YAML設定を生成して保存するので、そのまま実行に移せます。

# インタラクティブに要件を明確にし、設定を自動生成します
python scripts/gen_simple_agent.py

# 生成された設定を実行します
python scripts/cli_chat.py --config generated/xxx

自動エージェント生成 インタラクティブな対話によって要件を捉え、エージェントの設定を自動生成し、すぐに実行します。

自動ツール生成 必要な動作を伝えるだけで、メタエージェントがツールのコードとスキーマを作成し、そのままワークフローに組み込めます。

[!NOTE] 詳細については、ドキュメントを参照してください。

✨ 特徴

features

デザインコンセプト

シンプルなデザイン：フレームワークを簡素化し、不必要なコストを避けます。
モジュール化と設定可能性：柔軟なカスタマイズと新しいコンポーネントの簡単な統合が可能です。
オープンソースモデルのサポートと低コスト：さまざまなアプリケーションのアクセシビリティとコストパフォーマンスを向上させます。

コア機能

openai-agentsに基づいて構築：openai-agents SDKを基盤としており、ストリーミング、トレーシング、エージェントループの機能を継承しています。これにより、responsesやchat.completions APIとの互換性が保証され、gpt-ossなどの多様なモデルにシームレスに対応できます。
完全な非同期：高性能かつ効率的な実行を実現し、特に効率的な評価に有利です。
トレーシングと分析システム：OTELに加えて、DBTracingProcessorシステムはツールの呼び出しやエージェントのトレースに関する詳細な分析を提供します。（近日リリース予定）

自動化

YAMLベースの設定：構造化され、管理しやすいエージェント設定が可能です。
自動エージェント生成：ユーザーのニーズに応じて、エージェント設定を自動的に生成できます。
ツール生成と最適化：ツールの評価と自動化による最適化が可能で、カスタマイズされたツールの生成機能も将来的にサポートされる予定です。

用途例

深層/広範な研究：一般的な検索指向のタスクをカバーします。
ページ生成：特定の入力に基づいてページを生成する例があります。
トレース収集：トレーニングや研究目的でのデータ収集をサポートします。

🤔 なぜYoutu-Agentを選ぶのか？

Youtu-Agentは、さまざまなユーザーグループに価値を提供することを目的としています：

エージェント研究者や大規模言語モデルのトレーナー向け

基本的なReActよりも強力で、シンプルながらもパワフルなベースラインとなり、モデルトレーニングやアブレーション研究の優れた出発点となります。
実験プロセスを簡素化し、一貫したベンチマークテストを保証するためのワンクリック評価スクリプトがあります。

エージェントアプリケーション開発者向け

実際のエージェントアプリケーションを構築するための検証済みで移植可能なフレームワークです。
使いやすさ：シンプルなスクリプトと豊富な組み込みツールキットにより、迅速に始めることができます。
モジュール設計：EnvironmentやContextManagerなどの重要なコンポーネントは封装されていますが、高度にカスタマイズ可能です。

人工知能やエージェントの愛好家向け

実際の使用例：/examplesディレクトリには、ディープラーニングレポートの生成、データ分析、個人ファイルの整理などのタスクが含まれています。
シンプルさとデバッグの容易さ：豊富なツールセットと可視化トレーキングツールにより、開発とデバッグが直感的で簡単になります。

🧩 コアコンセプト

エージェント（Agent）：ヒント、ツール、環境が設定された大規模言語モデル。
ツールキット（Toolkit）：エージェントが使用できるツールの集合体。
環境（Environment）：エージェントが操作する世界（例：ブラウザ、シェル）。
コンテキストマネージャー（ContextManager）：エージェントのコンテキストウィンドウを管理するための設定可能なモジュール。
ベンチマーク（Benchmark）：特定のデータセットに対応したワークフローの集合体で、前処理、実行、判断ロジックを含む。

設計および実装の詳細については、オンラインドキュメントをご覧ください。

🚀 すぐに始める

Youtu-Agent は完全なコードとサンプルを提供しており、すぐに使用を開始するのに役立ちます。以下の手順に従って、最初のエージェントを実行するか、docker/README.mdを参照してDockerを使用してインタラクティブなウェブページを備えたサンプルを迅速に実行できます。

環境準備

リポジトリをクローンして依存関係をインストールします：

[!NOTE] このプロジェクトでは Python 3.12+ を使用しています。依存関係の管理には uv の使用をお勧めします。

まず、環境に Python と uv がインストールされていることを確認し、以下の手順に従ってこのプロジェクトをクローンして依存関係を同期させてください。

git clone https://github.com/TencentCloudADP/youtu-agent.git
cd youtu-agent
uv sync
source./.venv/bin/activate
cp.env.example.env  # NOTE: 関連する環境変数を設定する必要があります！

[!NOTE] .env ファイルに LLM API キーなどの関連する環境変数を設定してください。

すぐに始める

Youtu-Agent には設定ファイルが内蔵されています。例えば、デフォルトの設定ファイル (configs/agents/simple/base_search.yaml) では、検索ツールを備えたシンプルなエージェントが定義されています：

defaults:
  - /model/base
  - /tools/search@toolkits.search
  - _self_

agent:
  name: simple-tool-agent
  instructions: "あなたはウェブを検索できる役立つアシスタントです。"

以下のコマンドを使用してインタラクティブな CLI チャットボットを起動できます：

# NOTE: `.env` に `SERPER_API_KEY` と `JINA_API_KEY` を設定する必要があります（将来的には無料のツールに置き換える予定です）
python scripts/cli_chat.py --config simple/base_search
# 検索ツールを使用しない場合は、以下のコマンドを実行できます
python scripts/cli_chat.py --config simple/base

📖 詳細については：クイックスタートドキュメントを参照してください。

サンプルの探索

このリポジトリには直接実行できる複数のサンプルがあります。例えば、特定の研究トピックに基づいて自動的に SVG インフォグラフィック を生成することができます：

python examples/svg_generator/main_web.py

[!NOTE] WebUI を使用するには utu_agent_ui パッケージをインストールする必要があります。ドキュメントを参照してください。

研究トピックを指定すると、エージェントは自動的にネットワーク検索を実行し、関連情報を収集して SVG ビジュアライゼーションを出力します。

svg_generator_ui

svg_generator_result

📖 さらに多くのサンプルについては：サンプルドキュメントを参照してください。

評価の実行

Youtu-Agent では標準データセットでのベンチマークテストもサポートしています。例えば、WebWalkerQA 上で評価を実行するには：

# データセットの前処理。このスクリプトは WebWalkerQA データセットをダウンロードして処理し、データベースに保存します。
python scripts/data/process_web_walker_qa.py

# ww.yaml の設定を使用して評価を実行します。迅速な評価のために WebWalkerQA_15 という小さなデータセットを選択しました。
# NOTE: `.env` に `JUDGE_LLM_TYPE, JUDGE_LLM_MODEL, JUDGE_LLM_BASE_URL, JUDGE_LLM_API_KEY` を設定する必要があります。`.env.full` を参照してください。
python scripts/run_eval.py --config_name ww --exp_id <your_exp_id> --dataset WebWalkerQA_15 --concurrency 5

結果はローカルに保存され、分析プラットフォームでさらに確認できます。評価分析を参照してください。

eval_analysis_overview

eval_analysis_detail

📖 詳細については：評価ドキュメントを参照してください。

📖 さらに詳しく

クイックスタートを終えたら、完全なドキュメントを通じてフレームワークとその機能についてさらに学ぶことができます：

📖 完全なドキュメント: コアコンセプト、アーキテクチャ、および高度な機能をご覧ください。
🚀 クイックスタートガイド: 迅速にセットアップして実行するための詳細なガイドです。
❓ よくある質問: よくある質問とその回答をご覧ください。

🙏 お礼の言葉

このプロジェクトは、以下の優れたオープンソースプロジェクトをベースにしています： - openai-agents - mkdocs-material - model-context-protocol

🙌 貢献

私たちはコミュニティからの貢献を歓迎します！Youtu-Agentの改善にご協力いただける場合は、まず貢献ガイドラインをお読みください。

📚 引用

この研究が役立つと思われる場合は、引用を検討してください：

@misc{training_free_grpo,
  title={Training-Free Group Relative Policy Optimization},
  author={Tencent Youtu Lab},
  year={2025},
  eprint={2510.08191},
  archivePrefix={arXiv},
  primaryClass={cs.CL},
  url={https://arxiv.org/abs/2510.08191},
}

@misc{youtu-agent-2025,
  title={Youtu-agent: A Simple yet Powerful Agent Framework},
  author={Tencent Youtu Lab},
  year={2025},
  publisher = {GitHub},
  journal = {GitHub repository},
  howpublished = {\url{https://github.com/TencentCloudADP/youtu-agent}},
}

Extension points exported contracts — how you extend this code

EvaluationDetailProps (Interface)

(no doc)

frontend/exp_analysis/src/components/evaluation-detail.tsx

TextDeltaContent (Interface)

(no doc)

frontend/webui/src/types/events.ts

InputProps (Interface)

(no doc)

frontend/exp_analysis/src/components/ui/input.tsx

ExampleContent (Interface)

(no doc)

frontend/webui/src/types/events.ts

ThemeState (Interface)

(no doc)

frontend/exp_analysis/src/lib/theme.ts

PlanItem (Interface)

(no doc)

frontend/webui/src/types/events.ts

WorkerItem (Interface)

(no doc)

frontend/webui/src/types/events.ts

ReportItem (Interface)

(no doc)

frontend/webui/src/types/events.ts

Core symbols most depended-on inside this repo

get

called by 203

utu/db/utu_basemodel.py

frontend/exp_analysis/src/lib/utils.ts

model_dump

called by 44

utu/db/eval_datapoint.py

print_info

called by 38

utu/utils/print_utils.py

run

called by 36

utu/agents/llm_agent.py

load_agent_config

called by 34

utu/config/loader.py

Shape

Method 652

Function 476

Class 207

Interface 36

Languages

Python85%

TypeScript15%

Modules by API surface

utu/ui/webui_agents.py42 symbols

examples/ppt_gen/ppt_template_model.py40 symbols

utu/tracing/otel_agents_processor.py36 symbols

utu/ui/common.py32 symbols

utu/agents/simple_agent.py27 symbols

frontend/webui/src/App.tsx20 symbols

utu/utils/agents_utils.py18 symbols

frontend/webui/src/components/MessageComponent.tsx18 symbols

utu/utils/path.py15 symbols

utu/eval/benchmarks/base_benchmark.py15 symbols

utu/env/utils/docker_manager.py15 symbols

frontend/webui/src/types/events.ts15 symbols

Dependencies from manifests, versioned

@ant-design/icons6.0.0 · 1×

@ant-design/pro-components2.8.10 · 1×

@emotion/react11.14.0 · 1×

@emotion/styled11.14.1 · 1×

@eslint/eslintrc3 · 1×

@eslint/js9.33.0 · 1×

@mermaid-js/mermaid-cli11.9.0 · 1×

@monaco-editor/react4.7.0 · 1×

@mui/icons-material7.3.1 · 1×

@mui/material7.3.1 · 1×

@radix-ui/react-dialog1.1.14 · 1×

@radix-ui/react-dropdown-menu2.1.15 · 1×

Datastores touched

(mysql)Database · 1 repos

your_databaseDatabase · 1 repos

For agents

$ claude mcp add youtu-agent \
  -- python -m otcore.mcp_server <graph>

⬇ download graph artifact