生成AIの活用は、単発で質問に答えてもらう使い方から、実際の作業を継続的に任せる使い方へと広がっています。
その流れの中で注目されているのがSkillsです。
Skillsは、AIに特定の作業手順や専門知識を持たせ、必要な場面で再利用しやすくする仕組みです。OpenAIはChatGPTやCodex、APIでSkillsを案内しており、Gemini CLIも「Agent Skills」として同様の考え方を公式に紹介しています。さらにAnthropicも、Claude.ai、Claude Code、Claude Cowork、API向けにSkillsを展開しており、Skillsは特定の1製品だけの話ではなく、エージェント時代の共通的な設計パターンとして広がりつつあります。
この記事では、Skillsとは何か、どのような仕組みで動くのか、カスタム指示やMCPと何が違うのかを初心者向けに整理します。あわせて、Gemini CLIでExcelファイルを読み込ませ、PowerPointに集計結果をまとめさせるデモも紹介します。

Skillsは、AIエージェントに特定の仕事の進め方を覚えさせるための仕組みです。
毎回長いプロンプトを書かなくても、「この種類の依頼なら、この手順・この観点・この補助資料を使って進める」というまとまりを再利用できます。
OpenAIはSkillsを「再利用可能で共有可能なワークフロー」と説明しており、指示・例・コードをまとめて持たせられると案内しています。Gemini CLIも、Skillsを「specialized expertise(専門化された知識)」や「procedural workflows(手順化されたワークフロー)」を与えるための仕組みとして説明しています(OpenAI Help Center「Skills in ChatGPT」、Gemini CLI「Agent Skills」)。
つまりSkillsは、単なるメモや設定ではありません。
AIに渡す“作業マニュアル兼パッケージ”と考えるとイメージしやすいと思います。
たとえば、次のような用途に使えます。
Skillsは、基本的に1つのディレクトリ単位で構成されます。
その中心にあるのが SKILL.md というファイルです。
OpenAI AcademyやGemini CLIの資料でも、Skillは SKILL.md を中核にした再利用可能なまとまりとして案内されています。Gemini CLIでは、Skillを自己完結したディレクトリとして扱い、SKILL.md を中心に発見・有効化します(OpenAI Academy「Skills」、Gemini CLI「Creating Agent Skills」)。
SKILL.md には、主に次のような情報が入ります。
Gemini CLIの作成ガイドでは、SKILL.md に YAML frontmatter として name と description を持たせ、その後ろに具体的な手順や指示を書く構造が紹介されています。OpenAI Academyでも、Skillには名前・説明・手順・関連リソースを含める考え方が案内されています(Gemini CLI「Creating Agent Skills」、OpenAI Academy「Skills」)。
以下は SKILL.md の簡易的な構造例です。
---
name: weekly-report
description: 週次報告書を作成するSkill。売上データを集計し、所定のフォーマットで出力する。
---
# 週次報告書作成
## このSkillを使う場面
- 「週次報告を作って」と依頼されたとき
- 売上データの集計を求められたとき
## 作業手順
1. 指定されたExcelファイルを読み込む
2. 部門別・週別に売上を集計する
3. 前週比を計算する
4. `templates/weekly-report.pptx` の形式で出力する
## 参照ファイル
- `templates/weekly-report.pptx` - 出力テンプレート
- `references/kpi-definitions.md` - KPIの定義
冒頭の — で囲まれた部分がYAML frontmatterで、name と description を記述します。この部分がSkillのメタデータとして最初に読み込まれ、依頼内容に合致するかどうかの判定に使われます。
本文には、どんな場面で使うか、具体的な作業手順、参照すべきファイルなどを記述します。人間向けに言えばREADMEに近く見えますが、実際にはAIが読むための作業定義書として機能します。
Skillsの重要なポイントは、最初から全文が常時コンテキストに入るわけではないことです。
最初に読み込まれるのはSkillのメタデータ、つまり名前と説明です。そして、依頼内容に合いそうなSkillが見つかったときに activate_skill が呼び出され、そこで初めて SKILL.md 本文や関連リソースが読み込まれます(Gemini CLI「Agent Skills」)。
この設計には、実務上大きな意味があります。
よく使う専門知識や作業手順を毎回プロンプトに貼り付ける必要がなくなり、入力トークンの節約にもつながるからです。Gemini CLIはこの仕組みを "Progressive Disclosure"(段階的開示)と呼び、詳細を必要なときだけ読み込むことでコンテキストを節約できると説明しています。
Skillsの理解でつまずきやすいのが、似た概念との違いです。
ここで整理しておきます。
カスタム指示は、常時効かせたい前提を与えるものです。
たとえば、回答のトーン、役割設定、重視したい観点などです。
一方、Skillsは特定タスク向けの手順や知識を必要なときだけ読み込む仕組みです。Gemini CLIのドキュメントでも、GEMINI.md のような一般的なコンテキストファイルは「workspace-wide background」であり、Skillsは「on-demand expertise」だと明確に区別されています(Gemini CLI「Agent Skills」)。
両者を整理すると次のようになります。
| 項目 | 適用タイミング |
|---|---|
| カスタム指示 | 常時 |
| Skills | 作業ごと |
MCPは、AIが外部ツールやデータソースとつながるための接続方式です。
MCPの公式ドキュメントやGoogleのADKドキュメントでは、MCPはLLMが外部アプリケーション、データソース、ツールとつながるためのオープン標準として説明されています(Model Context Protocol「What is the Model Context Protocol (MCP)?」)。
MCPについては、下記の記事も参考にしてください。
一方でSkillsは、どういう手順で仕事を進めるかを定義するものです。
このように、両者は異なる役割を担っています。
| 項目 | 役割 |
|---|---|
| MCP | 外部とつながる |
| Skills | 作業の進め方を定義する |
もちろん両者は競合ではなく、組み合わせ可能です。
SkillでMCPの連携方法や活用方法を定義し、それに従って処理を進める、という使い方も自然です。
通常のプロンプトは、その場で依頼を書くものです。
単発の作業なら、それで十分な場合も多いでしょう。
ただ、同じ種類の仕事を何度もするなら、毎回長い指示を書くのは非効率です。
Skillsは、その繰り返し部分を外に出して再利用しやすくする仕組みです。
プロンプトが「今回の依頼文」だとすれば、Skillは「依頼を受けたときに参照する標準作業手順書」に近い位置づけです。
ここからは、実際のデモを紹介します。
今回はExcelをGemini CLIに読ませて、集計結果をPowerPointにまとめさせてみました。
実行環境の前提は次のとおりです。
まず、公開されているSkillを追加します。
今回使ったのは、Anthropicの公開リポジトリに含まれている xlsx と pptx です。Anthropicはこのリポジトリについて、ClaudeのSkillsシステムで何ができるかを示す公開例であり、docx、pdf、pptx、xlsx といった文書系Skillも含まれると説明しています(GitHub「anthropics/skills」)。
npx skills add https://github.com/anthropics/skills --skill xlsx
npx skills add https://github.com/anthropics/skills --skill pptx
この2つは、公開されている文書処理系Skillの中でも、そのまま試しやすい組み合わせです。


Gemini CLIの場合は .agents/skills (もしくは .gemini/skills) に配置します。なお、Codexの場合は .codex/skills、Claude Codeの場合は .claude/skills です。
各種エージェントで共通で使う場合は、マスタとなるディレクトリを決め、そこからシンボリックリンクを貼る方法もおすすめです。
次に、Gemini CLIへExcelファイルを渡して指示します。
@blog/assets/gen-ai-skills-introduction/従業員エンゲージメント調査_生データ.xlsx これを分析して、パワーポイントに集計結果をまとめて下さい。
今回は、従業員エンゲージメント調査のExcelデータを読み込ませ、分析結果をPowerPointに整理させました。


デモでは、Gemini CLIがまず xlsx Skillを有効化し、Excelの構造や列情報を確認してから集計処理を進めていました。
Gemini CLIの公式ドキュメントによると、Skillが依頼内容に合致した場合、モデルが activate_skill を呼び出します。ユーザーの確認を経て、Skillの本文やリソースがコンテキストに注入される仕組みです(Gemini CLI「Agent Skills」)。
その後、分析結果をもとにPowerPointの作成に進み、pptx Skillを使ってスライド生成まで実行してくれました。



最終的に、従業員エンゲージメント調査_結果報告.pptx が生成されました。
分析サマリだけでなく、グラフや比較表を含むスライドまで作成されています。


このデモのポイントは、単に「Excelを読める」「PowerPointを作れる」ということではありません。
公開されているSkillを追加するだけで、生成AIが必要なタイミングでそのSkillを読み込み、複数ステップの処理を一連の流れで進められるという点にあります。
ここまで見ると、Skillsは一部の上級者向け機能に見えるかもしれません。
ただ、実際には既に公開されているSkillだけでもかなり幅があります。
デモで使った npx skills add コマンドは、skills.sh というSkillsのエコシステムからSkillをインストールする仕組みです。このサイトでは、Claude Code、Gemini CLI、Cursor、GitHub Copilotなど20以上のAIエージェントで利用できるSkillが公開されており、React開発ガイドライン、Webデザイン標準、フロントエンド設計など、多種多様なSkillが登録されています。
Anthropicの公開リポジトリにも、文書系の docx、pdf、pptx、xlsx だけでなく、デザイン、テスト、自動化、業務支援など、さまざまなSkill例が含まれています(GitHub「anthropics/skills」)。
まずは既製のSkillを導入して試すだけでも、かなり多くのことが実現できます。
一方で、既製Skillだけで十分かというと、必ずしもそうではありません。
実務では、次のようなケースがよくあります。
こうした要件は、既製Skillだと少しずつズレることがあります。だからこそ、Skillsは「公開されているものを使う」だけでなく、自分たちで作る価値があります。
OpenAI、Google、Anthropicの3社とも独自のSkillの作成方法を案内しており、skill-creator のようなツールを使った新規Skillの作成や、会話からSkillを生成する機能が提供されています。
便利なSkillを探して試しつつ、足りない部分は自作する、という運用が現実的といえます。
Skillsは便利ですが、いくつか注意点もあります。
まず、出力内容は必ず確認する必要があります。
Skillがあるからといって、結果が常に正しいとは限りません。分析結果、文章、集計ロジック、スライド構成などは、人間が最終確認すべきです。
次に、公開されているSkillをそのまま導入する場合は中身を確認することも重要です。Anthropic自身も、公開している skills リポジトリについて「デモ・教育目的」の要素があること、そして重要な用途では十分にテストすべきことを明記しています(GitHub「anthropics/skills」)。
Skillには、実行手順、参照ファイル、利用するスクリプトなどが含まれます。
内容を理解しないまま業務データに対して使うと、想定外の処理や不適切なファイル参照につながる可能性があります。特に機密情報を扱う場合は、配布元の信頼性、Skillの中身、参照先、実行権限を確認してから使う必要があります。
Skillsは、生成AIに特定の作業手順や専門知識を持たせるための仕組みです。カスタム指示が「常時の前提」、MCPが「外部接続」だとすると、Skillsは作業の型を与える役割を持ちます。
また、SKILL.md を中心にしたディレクトリ構造で管理され、必要なときだけ段階的に読み込まれるため、毎回長いプロンプトを渡し続けなくてよいのも実務上の大きな利点です。
今回のデモのように、公開されている xlsx や pptx のSkillを追加するだけでも、Excelの分析からPowerPoint作成までを一連の流れで任せられます。
そのうえで、既製Skillでは足りない部分が見えてきたら、自社の業務に合わせたSkillを作っていく。これがSkillsを実務に取り入れる自然な進め方といえます。
Tech Funでは、お客様のフェーズに合わせ、生成AI活用に向けた支援を3つのパックでご提供しています。
生成AIに限らず、Web・業務システム開発やインフラ設計など、技術領域を問わずご相談を承っています。「何から始めれば良いか分からない」という段階でも構いませんので、ぜひお気軽にお問い合わせください。