一切かっこつけずに申しますと
正しくは
『iPhoneアプリ開発の素人が、
AIと協力して開発してみたら、分からないことだらけだったので、
問題のない状態を構築していたらAIのオーケストラになっていた件』
なのですが(震)
『AIオーケストレーション』とは
複数のAIサービス(AIモデル、AIツール、AIエージェント等)を利用して、
ビジネスやプロダクトの複雑な仕組みを自動化したり、
より複雑・規模の大きなテーマに取り組むために管理運用すること。
平たく言えば、
『オーケストラの指揮者のように、
たくさんのAIと協力して、
すっごい演目をやりきります!』
となります。
今回は、
はじめてのアプリ開発から、
段階を踏んで難しいことにチャレンジした記録。
現在はどんなAI仲間との連携をしているか、
赤裸々な状態をご紹介します。
目次
バイブコーディングのきっかけ
たまたま趣味の筋トレがこうじて、
自分のトレーニングに合ったアプリを探していたところ、
ガチ勢のウエイトトレーニングにマッチしたものがなかった。
AIがだいぶ浸透してきているこの時代に(2025年11月末)、
バイブコーディングなんて言葉もよく見るようになり、
どうせなら勉強がてら自分用にアプリ作ってみればいいじゃん!
となったのがきっかけ。
※バイブコーディングとは、
制作者の『こんな感じで』みたいなノリと普通言語で、
AIと開発するコーディング手法。
※個人開発に必要となった環境についてはこの記事
『個人でiPhoneアプリを作るのに必要な環境と費用(2025年12月時点の実例)』をお読みください。
第一作目は『筋トレタイマー』
この時のAIパートナーは『chatGPT5.1』のみ、
12月11日ごろにGPT5.2にバージョンアップするも、
それは最後の検証の頃だったので、
それほど違いは分からなかった。
『アプリ開発経験ゼロの僕が、
AIと組んだら出来そうな難易度のアプリを、
複数個挙げて』
スタートはそこから。
そのラインナップを見て、
大体の規模や難易度を想定、
自分が欲しいと思うものをメモ帳に書き溜めた。
『僕の書き溜めたアプリアイデアです。
この中から経験ゼロの初心者でも、
脳汁溢れない程度の難易度をチョイスして』
そうして絞り、
結局最初に作りたかった
『筋トレタイマー』で決定。
初めてのバイブコーディング
- 他には無い独自のポイント
- 仕掛けとして難しくは無いか
- 入れ込む機能と削ぎ落とす機能の選択
これらを相談しながら絞れた所で、
それを元にファイル構成と、
もう最初から動くほぼ完成のところまで
一気にコード化してもらった。
xcodeで開き、
ドキドキしながらプロジェクト名、
バンドルIDなんかをググりながら記入。
(AIの情報と現環境とで微妙に違いがあって混乱するから、
ググった方が速く確実な場合もある)
- エラーが起きればスクショを放り込み
- 思ったんと違ったら相談
- 一般的、Appleのアプリとして必要なことを、実データにその都度追加
スクショ連投とコピペの嵐。
もう自分がxcodeとchatを行き来する、
コピペゾンビに徹していた。
しかし、ここで思いもよらない事が起こる。
AIの記憶のブレと進行の食い違い
『この方法なら安全。完璧にAppleに準拠!』
とお勧めされた方法が、
実は古い手法で、
今では違反に当たるものだったと判明。
(バックグラウンド動作での処理方法や、
スプラッシュスクリーンの扱いに関する知識)
また、
『この行程で進めていこう!』
と描いてくれたあおがき(設計)が、
あるタイミングからガンガン無視して進行される。
最初とズレている。
それは進行だけではなく、
使用する技術やコードの種類にも及び、
だんだんと
Swiftファイル間の繋がりに綻びが出始める。
なんど修正しても、
他の修正が生まれ、
やがてレイアウトが崩れても、
AIはその違いを理解できなくなった。
AIエージェントへの入門
今までの人生の経験上、
ここで面倒くさがって手放すと、
復帰するにも
他に進むのも億劫になる。
考えた結果、
openAIのアカウントで、
そのまま利用できるCodex CLIに行き着いた。
タイミングよく、
Codex CLIの上位モデルとなる、
Codex MAX CLIがリリースされたばかり。
(コマンドプロンプト上で、
AIが実際のファイルをいじれるようになる、
コマンドベースのAIエージェント)
僕のデスクトップで産声を上げたCodexちゃんに、
他に保存していた進行不能になる前の、
まだキラキラしてた頃のデータを放り込んだ。
─── ヤダ、すっごく速くて的確!?
この時、
データとして動かぬ記憶をいじる事が、
曖昧なプロンプト(指示)の重なりで起こる、
AIの思考のブレを抑えられるのだと実感した。
chatGPTとCodexちゃんとの違い
作業的に言えばもう明白。
chatGPTは対話型であり、
アイデアのまとめや、
アドバイスに向いている。
Codexはコーディングエージェントであり、
実務的なコーディングのエキスパート。
じゃあアプリ開発には、
Codexだけでいいかとなると、
やっぱり違う。
chatGPTは『こうしたらいいんじゃない?』
Codexは『目の前のコードをなんとかする職人』
なのだ。
つまりCodexのみでは、
プロジェクト全体の進行や、
全体のカラーリングをするような作業に向いていない。
僕のような素人の甘ちゃんには、
全体の概要をサポートするchatGPTと、
実務で走るCodexがそろわなければ、
ただのコピペすら出来ないゾンビなのだ。
人間の必要性
Codexちゃんの活躍により、
堂々巡りアドバイザーと化していたchatGPTが、
しれっと何事もなく精彩を取り戻す。
まもなく初めてのアプリは完成し、
Apple Store Connectへの審査へと突き進む。
が、ここでも再び沼にハマる事となる。
─── やっぱりAIの情報と現環境とでズレが生じていた
Appleの規約を読んでいても、
実際にアプリの登録作業の手順やコツは、
体験して学ばないとさっぱり分からない。
- 独特な用語
- 場面によって変わる呼び名
- ある程度まで進めないと出現しない項目
これらは必要だからこその要素だが、
初見では正直イジワルなんじゃないかと、
疑ってしまうくらい分からない!
そんな中、
何度となくchatGPTに質問し、
目の前のディスプレイとの違いに狼狽し、
やっと出せたと思えば、
❌満点の却下レビュー。
正直、もう何を信じれば良いのか、
分からなくなりかけていた。
第三のAI『Gemini』
3度目の申請却下。
僕はchatGPTと、
とてもフレンドリーな仕事仲間として、
朝の会話をした後、
Google Geminiの門を叩いていた。
Codexに次ぐ、
第三のAIへの救難申請である。
その時はまだ、無料ではGemini3を利用できなかったが、
正直驚いた。
指示が的確で分かりやすい。
説明の順の追い方、
こちらから渡すべき情報の指定、
次にやるべき事の予告。
シゴデキだ!
気がつけばGeminiを『姉さん』と呼ぶようになっていた。
それぞれのAIたちの長所短所
ボツにしたものを含めたら、
アプリ開発も8個を越えた。
その中でよく分かったのが、
■chatGPT
流れを忘れたり、説明が足らない、仕様をガラリと変えてくる事がよくある。
「こうしたら良いじゃん」と言う存在。
つまりコードを書かせる方向に行くと、
ファイル数が増えた時に、整合性が保てなくなりがち。
Xcodeの不具合修正や、ファイル構成なんかの相談、説明文やキーワードなどの作成に強い。
codex cliへのプロンプトを書かせると相性が良い。
現状を検証させると強い。
■Gemini
分かりやすく親切で、絵も描けるし、企画力も高い。
ただし、慎重派な面も強く、時折り回りくどい方法に行くこともある。
そして突然ガラガラピシャーンとシャッターを閉めることも。
chatGPTとcodexのタッグで暗礁に乗り上げた時、
鮮やかに解決したりする姉さん。
オールマイティに能力が高いが、
時折り興奮状態になるのか、
グイグイ思考を走らせて止まらなくなる。
突然、文末に英文が混じり出すと起こる。
■codex max cli
職人。
直接データを触ってくれるし、
コマンドラインだけあって、
環境を整えたりもやってくれる。
chatGPT3.2モデル搭載した辺りから、
コーディングの安定感は更に進化した。
ただし『目の前のコードをなんとかする』存在なので、
使用コードの前提でつまずいた場合など、
無理矢理な迂回方法を繰り返したりする。
ありがちなのは、レイアウトで指定方法を見直せばいける時でも、
パディングで必死に調整してたりする。
(インストールしたマシンごとに独特な個体差もある気がする)
だんだんとアプリ開発にも慣れ、
開発の難易度を上げていくうちに、
こうした彼らAIの長所短所も見えて来た。
特に工程数と階層が複雑になると、
chatGPTとcodexのタッグでは、
突如として違う方向に行ってしまう事が出てくる。
そこに姉さんを加えても、
全ての状況を伝え切れるわけではないし、
たくさんのデータファイルを見てもらうのも大変。
と、いうことで
更に新たなAIのお友達をお迎えする!
第四のAIエージェント『Antigravity』
『これまでのコーディングAIエージェントのように、
人間が指示して組み上げていくのではない。
Antigravityがあらゆる計画を立て、
一気にプロジェクトを完成させる。
人間は提案された計画や行動に許可を出すだけ』
ちょっと凄すぎて、何言ってるかわかんない。
ってことで挑戦あるのみ!
基本的な使い方の流れとして簡単に説明すると
- VScode(Googleのコーディングアプリ)に追加するor最初から導入されたものをインストール
- Cockpitと呼ばれる所から、通常のLLMと同じく普通言語で作りたいものを提案
- 返ってきた計画書(Implementation Plan)を確認、修正/実行を指示する
- 出来上がる
ちょっと凄すぎて何言ってるのか分かんないw
でも実際完成してしまうのだ
しかし、良いことばかりではないとすぐに判明する事となる。
『Antigravity』の弱点
最強、最速の怪物に思われたAntigravityにも
実は弱い点が存在している
『問題解決やエラー修正時、
コーディングAIエージェントがやりがちな泥沼にハマる』
具体的には
■『ScrollView』など、
複数存在するとぶつかりかねないコードを
平気で複数重ねて複雑にしてしまう。
そして修正を依頼すると、
延々と小手先のパディング調整なんかで修正しようとする。
で、ドツボにはまる
■VScodeなどで起こるエラーに対しても
『エージェントに送信する』という解決楽勝ボタンが有るが、
上記のように一つの問題を
延々と同じやり方で押し通そうとする。
最速最強ではあるものの、
つまづくと時間泥棒さんになりかねないのだ。
(ただし、これは全てのコーディングAIエージェントの持つ弱点)
要はコーディングAIエージェントは総じて
『眼の前のコードしか見ていない』
という途上な部分が存在する。
AIオーケストレーションでアプリ開発ということ
- 各AI / AIエージェントには得意不得意がある
- どこまで行っても人間が判断を下すことは変わらない
- 人間が勝てる領域は決断力と、将来に向かう情熱
得意不得意に関しては、
例えばAIエージェントがつまづいてループを始めた場合、
人間の経験かchatGPTやGeminiなどのLLMと広い視野で修正する。
逆にLLMが上手く思い通りな計画を保てない時は、
思い切ってAIエージェントに先行で作らせる。
そのプロジェクトをコピペするなりして共有すると、
突然何事もなかったように動き出す。
僕の場合
個人でやるには規模が大きいプロジェクトだなと思ったら
- LLMに相談して壁打ちから
- 全体像や重要なコードを部分部分で生成し
- 全体像と仕様を
- どんな段階分けすれば良いかを決める
(AIエージェントの多くは、一気に長いプロンプト渡すと混乱しがち)
⭐️Gemini
全体的な計画立案
デザインのラフ
途中、何かに立ち止まった時の救世主
ただ慎重な割に突っ走る傾向もある
⭐️chatGPT
検証するのに非常に強力
AIエージェントがつまづいている点の割り出し
修正案の提案に強い
ただ大事なことをすっぱり忘れる傾向あり
思い込みもやや強い
⭐️codex Max CLI
コーディングのエキスパート
ほとんどこれだけで行ける
ただしつまづきに弱く
派手なアニメーションや演出の発想は弱い
⭐️Antigravity
コーディングのエキスパート
例えるならcodexを現場監督兼職人とすると
Antigravityは気鋭の建築家
大きくざっくり外観を作る
アニメーションや演出強い
結局、個人の僕は
AIオーケストレーションというより、
まだまだ僕とAIの長所短所を、
お互いに補い合っている段階です。
chatGPTとcodexは月2900円で同時に使えて
GeminiとAntigravityも月2900円で同時に扱える
料金的にも辛い額ではないしね。
まとめ
個人でアプリ開発をするのに、
もはやAIの導入は必要どころか、
前提となるでしょう。
ただ、AIの成長はまだまだ途中(2026年初頭現在)
今僕が利用している4つのAIサービスのバランスも変わっていくはず。
長所短所がそれぞれにあり、
場合によっては大きな時間的ロスになることもりますが、
それは人間側が想定して先導することでセーブできます。
小さなアプリでは数時間で完成するし、
むしろアプリ登録や説明用の画像を作ることに、
一番時間が取られている現状。
Webサイトの構築なんて1~2週間かかっていた規模のものが、
2時間で完成する場合もあります。
個人で運用する場合
こういった開発は即収入になるものではなく、
将来的な資産として考えると、
AIの速度を利用して、
広く資産形成しておく事が肝要。
単体のAIサービスを利用するのではなく、
これら長所短所を踏まえて、
自分好みなオーケストラを作るのが近道ではいかと考えています。