Chrononglyph

ai

#8161

手がかりとしてのスマホ環境

今日の出来事ai

Codexを導入して3ヶ月ちょい経ちましたが、使い方によって明暗が分かれています。
まず、真っ当な使い方としての開発エージェントとしての使い方はおおむね順調かなと思っています。
Codexがいなかったら何ヶ月かかっていたんだろう、という難解なタスクもあっさりできるようになった。
イチから大規模なアプリを作る実践はまだですが、複雑な要件でなければなんとかなりそうな気はしています。
ただし、「理解負債」という新しい概念も登場していてこれは折りに触れて対処したいところ。
Codexに任せれば任せるほど自分のリポジトリなのに自分が理解できない部分というのが増えていくため、
意識的にキャッチアップしないといずれ初歩的な改修でさえ人力では行き詰まってしまいます。
幸い、キャッチアップ自体もCodexが補助してくれるので解決の見通しは立てやすいですが、
実務的には時短したい欲求との戦いになりそうな気がしています。
まぁ、過信は禁物ですがその辺も人間が入力するプロンプト次第なところもあり、便利なツールであることは確か。


一方、あまり順調とは言えないのがナレッジベースのアシスタントとしての運用。
自分は創作に関する設定メモをかつてはアナログノート、2010年以降は主に着想メモとしてEvernoteに溜めていましたが、
今年初頭にこれをプライベートリポジトリ化してプロジェクトとしてまとめました。
こうすることによりCodexは横断的に情報を探索することができるため、
情報の整理(矛盾がないかどうか等)、断片的な情報の集約、創作に関する壁打ち相手などに応用できるようになります。
これで創作はさらに発展する……かに思えたのですが、実際にはあまり捗っていません。
絶対にいままでよりも合理化が進んでいるのになぜ?


これは、シンプルに「スマホに対応していない」というのが原因のひとつであると思っています。
創作活動自体は腰を据えてPC環境でするのが当たり前かもしれませんが、
「創作設定を練る」という行為自体はいつどこでも発生しうる着想によって進展するものであるため、
思いついたらさっと取り出してさっとやめられるスマホの方が相性は良いです。
実際、これまで創作設定が発展してきたのは最速メモアプリ「Drafts」のおかげといっても過言ではなく、
そういう意味ではもう創作活動(の下地作り)はここ16年ほどはスマホが舞台なんですよね。


しかしCodexは現時点でスマホに対応していません。
web版なら対応していないわけではないものの、ネイティブ対応でない時点で利便性は劣るのが現実です。
じゃあ「2025年は創作が捗った」というのはなんだったのかという話になるわけですが、
Codex導入以前はChatGPT Projectsという機能で創作の壁打ちをしていたのでスマホでの創作設定が捗っていたんですね。
いまでもそれはできるんですが、こっちで進めてしまうとCodex側との情報に差が出てしまうし、
かといって現状ProjectsとGitリポジトリを同期する手段は存在しないのでどうにもならないという状況です。
まぁ、こうした現状を踏まえるといったんCodexは考えないでProjectsに絞るのが無難な気はしますが。
確かにナレッジベースを作れるのは魅力的ではあるものの、
それも「腰を据えて取り組む」タイプのタスクということなのでしょう。
情報が散乱しているのは確かなので、その整理こそ腰を据えてやりたいというのは考えているのですが、
優先度が高いわけではないのでなかなか手が出ていないのが現状です。GW計画に組み込んでみてもいいかも。


というわけで「創作はスマホ環境必須」というのがここ3ヶ月で新たに生まれた反省です。
創作は去年と違って今年はマストの計画ではありませんが、去年の勢いを殺さない程度に続けたいところです。


#8146

有能な新人としてのAI

今日の出来事ai

02月からCodexで本格的にバイブコーディングをするようになって2ヶ月ほど経っていますが、
バイブコーディングという概念に対して当初抱いていたイメージと現在のイメージがだいぶ異なるので、
軽くその辺の差異について振り返っておくことにします。


まずバイブコーディングデビューした02月当時は、ものすごい開発実績を叩き出しました。
わずか1週間で全体的に低迷傾向にあった2025年の7ヶ月分に相当する規模の改修を行い(#08095 / 2026年02月13日)、
既存のwebアプリはSEO対策、セキュリティ対策、累積的なバグ修正などといった
人力コーディングでは工数の割に報われないので放置されてきたタスクが一気に片付きました。
こうしたどのようなwebアプリにも通用するような実装については、今後もAIに丸投げで良いと思っています。
これは個人のwebアプリ制作プロジェクトにAIという力強いコーダーが新たに入ってきてくれたような感覚でした。
ただ、その後も継続して新機能追加や既存コードの整理を進めていくにあたって、
やはりCodexも数あるコーディング支援ツールのひとつでしかなく、
結局のところ開発主体は自分なのだという認識が強くなっていきました。
もちろんこれはGPT-5.4現在の話でしかなく今後どうなるかはわかりませんが……。


そう思った理由はもちろん意図通りにコーディングしてくれないことがあるという実体験があるからです。
まずAIは基本的に、人間の指示は絶対のものとして解釈します。
つまり人間の指示からして方向性が誤っている場合、AIは必然的に誤っているコードを生成してしまうわけですね。
明らかな間違いはAIが実装を開始する前に確認してくれるかもしれないし、常に確認するように指示することもできます。
しかし、「自分が実装したいこと」を自分が常に正確に言語化できるとはかぎらず、
それぞれの単語のニュアンスによって方向性が微妙に異なるようなケースでは、AIは基本的にその違いを指摘しません。
さらに、実装したいことを過不足なく言語化したとしても、AIがそれを正確に解釈してくれるとはかぎりません。
AIは常にプロジェクトファイルの内容のすべてを把握しているわけではなく、
人間で言えば「めちゃくちゃ有能だけど入ったばかりの派遣社員」みたいなものなんですね。
なのでマニュアル(AGENTS.md)がよほどしっかりしていないと、AIは各ファイルの役割を正確に把握できません。
これによって齟齬が生まれると、わりと簡単にAIは勘違いします。


「プログラミングまったくできないけどClaude Codeに丸投げしてアプリ開発できた!」
というようなドヤ顔ブログをたまに見かけますが、ああいうのはイチからAIに委託するのでむしろ簡単なんです。
なぜならAIが全容を把握しつつコーディングできるので。
既存のプロジェクトにエージェントAIを導入する場合はそういうわけにいきません。
必ずどこかで人間がAIにコードの仕様、意図、役割を説明しなければならず、
そうしたドキュメントの作成をサボってきたプロジェクトではAIはあまり役に立たないこともありえます。


AIは強力なツールであることは間違いないしSEO対策みたいな汎用的なタスクの処理はすぐできますが、
既存アプリを土台に新機能を組み込むような場合は結局人間側もそこそこ頑張らないといけないということです。
もちろん、土台作りの段階からAIにフォローを入れてもらうのもアリですが、
いずれにしろAIにプロジェクトを理解してもらうテクニックは今後の開発で重要になってくるんじゃないかなと。
Codex登場当時はもう人間がコーディングする時代は終わったなどと思ったものですが、
プロジェクト整備やマニュアル化・言語化の重要性がさらに増したこと、
何も考えずにAIに任せっぱなしだといずれ人間はコードさえ理解できなくなる危険性など(#08132 / 2026年03月22日)、
むしろ人間側の負担が増えたような気がしないでもないです。


#8137

AI業界の選択と淘汰

おととい、OpenAIが動画生成プラットフォーム「Sora」をサービス終了することを発表 し、話題になっていました。
画像生成のDALL-Eに続いて動画をAI生成できるサービス、
しかもスマホ完結で誰でも使えるということでリリース当初は招待コードの争奪戦が起きるほど人気でしたが、
著作物の無断使用、有名人のディープフェイクなどで方々から叩かれるようになり、
リリースしてからすぐに機能を大幅に制限することに。
その後ずっと音沙汰がありませんでしたが、このたび製品研究の「選択と集中」のために切り捨てることを決めたと。
また、これによりxAIのイーロン・マスクは「Grokの動画生成を強化する」との声明を発表しており、
動画生成のニーズを囲い込もうとしているように見えます。
ただ、そのGrokも最近画像編集・動画生成機能である「Grok Imagine」の使用制限を大幅に強化しており、
現状はSuperGrokという月5,000円のサブスク課金をしないとほぼ使えない状況です。
動画生成については無料で使える時代は早くも終わったと見てよさそう。


個人的なイメージでは、Grokは生成コンテンツの権利があいまいで不安定なため、
オリキャラの生成には適していないと考えています。なんというか、AIポルノのためのAIという不健全なイメージが強い。
実際、Grokではスパイシーモードを有効にするとある程度までのポルノの生成が許容され、
これは他のクラウドベースのAIとは大きく異なる点です。
そういうプラットフォームに大切なオリキャラを預けるのはちょっと勇気が要ります。


Soraは基本的に不健全さを徹底排除する方針だったのである意味Grokの対抗馬として有望だったのですが、
個人的にSoraが失敗したと思うのはSNSという体裁を採ったことです。
つまり、生成した動画は公開するという前提でUIが設計されていたわけです。
基本的にAI生成コンテンツは自分が個人的に楽しむために作るもので、それ以上の目的はありません。
また他人のAI生成コンテンツを見たいともまったく思わない。
「自分が作った」という部分が大事なわけで、SNSにしてしまったのはそういうニーズへの無理解があったと思います。
まぁ、自分みたいなスタンスの人はマイノリティなのかもしれませんが……。
正直、普通にDALL-Eと同じようにChatGPTに組み込んでほしかったですね。


AIのコンテンツ生成サービスは世界的にコンプラとの兼ね合いで試行錯誤の状況が続いています。
Grokの動画生成も最初期は「なんでもあり」でしたがTwitterのディープフェイク問題を経て現在は大幅に制限されています。
GoogleのNanobananaも年末年始ごろはかなり制限が緩和されていましたが、
おそらくGrokに追従したのか現在はめちゃくちゃ厳しくなっています。
ChatGPTは相変わらず保守的な運用が続いており、
第1四半期以内に文字ベースでアダルトな会話ができるモードをリリースすると言われていましたが、
結局周囲や社内からの反対を受けてリリースを断念したと報道 されました。
一連の流れは、やはりGrokがTwitterで調子に乗って大批判を浴びたことで決定的に風向きが変わった気がします。


報道だけ見ていると、最近はOpenAIがとにかく逆風を浴びているような気がします。
まもなく課金継続して丸1年になる自分としてはChatGPTがやはりしっくり来るので頑張ってほしいところですが、
メモリの問題、コンプラや倫理の問題、果ては政治的な問題までChatGPTを取り巻く「敵」はあまりにも多く、
いまのところこのAI過渡期がどこに向かっているのかはまったく分かりません。


#8095

web制作は上流工程へ

今日の出来事web制作ai

Codex導入以降、web制作が捗りまくっています。
具体的にはピクチャレ大会の改修が10コミットに達しており、これは低迷していた2025年の7ヶ月分の作業に相当します。
必要性は感じているが見た目の変化に乏しいので改修モチベーションを捻出できない、
といったような保留タスクが一気に進んだ感じですね。セキュリティ関係とかちょっとした不具合とか。
このブログも先日プロジェクト全体のセキュリティ強化を実施しましたが、
Codexが出してくれたレポートによると驚くほど多くの脆弱性がありました。
このブログはGPT-4の時代にChatGPTに大部分を書いてもらった経緯があり、
自分にとっては初めてのAIコーディングによる成果物です。
ただ、当時はまだエージェント機能は使えなかったので1ファイルずつ作らざるを得ず、
そのため機能単位でAIにコードを書いてもらって自分がそれを該当箇所に埋め込むという作業が主でした。
総合テストなんてやっていません。
そういう経緯もあり、ファイル間の連携が雑だったのは間違いありません。
が、しかしまさかこんなにガバガバだったのかというほどたくさんのセキュリティリスクが出てきました。


実は02月01日復帰前にこのブログはまた攻撃されたのか、
それとも内部の不具合だったのかコンテナが暴走してCPUを食い続けるという事故が発生し、
去年末のReact2Shellに続いてまたしても強制シャットダウンを経験しました。
セキュリティを見直そうと思ったのはそういうきっかけがあったからですが、
このタイミングでCodexと出会えたのは運が良かったと思います。これが無かったら相当の難工事だったでしょう……。


とはいえ、Codexがあまりにも有能なら人の手はもう不要なのかというとそういうわけでもありません。
体感では、コーディングをAIに依存すればするほど、人間が自然言語で書くプロンプトの重要性は高まっています。
やってほしいことを一言一句漏らさず言語化する必要があるからですね。
軽微な修正では、プロンプトをしっかり書いて指示するより自分で改修した方が早いケースもまあまああります。


結局、AIに指示するためにはシステムのことを十分理解していないといけないし、
web制作の基礎知識もそれなりに求められます。
書く内容がコードそのものではなく自然言語になっただけで、やっていることはあまり変わっていないような気も。
ただ、知識を補填して完成度の高いコードを爆速で書いてくれるので間違いなく効率は上がりました。
個別の言語化があまり必要ないセキュリティ強化などは本当にやりやすくなりましたね。
AIのおかげでwebサイト全体のセキュリティは長い目で見てかなり強化するんじゃないだろうか。


一通り保留タスクを片付けたら、次はいよいよ大規模開発をCodexでやっていくつもりです。
これはまず「仕様書の整理」といういままでやってこなかったタスクが待ち構えており、
これをどう片付けるかという問題になりそう。
趣味のweb制作活動も、今後はシステム開発における上流工程みのある作業にシフトしていくんでしょうね。


#8090

バイブコーディングの新常識

今日の出来事ai

ゴールド先物で抑圧されていた行動力が少しずつ回復している兆しがあり、
この連休中は少し前に環境を整えていたバイブコーディングをより本格的に試してみました。
ここでいうバイブコーディングとは、人間は自然文で指示を書き、AIがコーディングを担当する開発手法です。
少し前(去年前半?)まではプロンプトエンジニアリングといえばあくまでも人間が主体で、
人間がわからない部分のスニペットをプロンプトに入力してAIが改善案を提示するといった趣でしたが、
いまや人間が直接コードを書くことは無くなっています。
ChatGPT CodexやClaude Codeのようなエージェントならプロジェクトを横断的に読み取ることができるので、
人間はどのコードの何が問題かといったことさえも把握しなくても済むからです。


試しに、人力でやるのが面倒で後回しにしていた軽微なセキュリティ課題について投げてみたところ、
驚くほど的確に改修が必要な複数のファイルについて直してくれました。
年単位で放置していた課題がこうもあっけなくクリアするのを見ているとなんとも言えない気持ちになります。
そして、コーディング環境がこのように激変したことで新たな課題も浮き彫りになってきました。
それはバージョン管理の問題と、テストの問題です。


自分はバージョン管理についてはこれまでかなり我流で、悪く言えば非論理的な切り方をしていました。
要するに作業がひと段落するごとに切っているので、同じコミットに複数の機能が混じることもあったわけですね。
しかし今後は基本的に「Codexのタスク1個ごと」に切るのが妥当だと思っています。
これは、AIが施した改修が破壊的な変更でない保証はどこにもない以上、作業単位で巻き戻せる必要があるからです。
逆に言えば、そこさえ徹底していれば破壊的変更も多少は恐れずにCodexを使うことができる。


あとはテストの必要性です。
これまでは改修内容をコード単位で自分が100%把握していたのでテストの必要性は必ずしも高くなかったですが、
今後は事実上AIとの共同開発というスタイルに変わっていくので、
コードレベルでどういう動作になるか把握しきれなくなることが予想されます。
コードを把握していないのに本番環境にぶち込んだらどんな想定外の事態が起こるか分かったものではありません。
そこで、最低限デバッグ用のページを作るなどして人間の目を通す重要性はかなり増したのかなと。
これは正直開発内容によっては徹底できるかわかりませんが、
まあテストケースも作るのはAIなのでその気になればなんとかなりそうな気はします。


バージョン管理やテストはいままでおざなりにしていた工程でしたが、
今後はむしろ人力でできる数少ない作業として重視することになりそうです。
あとはマニュアル(AGENT.md / CLAUDE.md)の整備ですね。要するに指示書。
これをどこまで正確に書くかでAIの精度も大きく変わってくると思われるため、
AIにやってほしいことを言語化するスキルが問われてくるのではないかと思います。
結局そのためにはコーディングを含む開発の知識もある程度は必要になってくるので、
バイブコーディング以後もこれまでの知識は無駄にならない……と信じたいところですが、実際どうなんでしょうね。
ともあれ、しばらくは長く保留していたセキュリティのタスクや微妙に面倒なタスクを処理することになりそう。


ちなみにCluade CodeではAIエージェントを複数立てることができ、
エージェントAはテストを、エージェントBはコーディングを、といったように役割分担することができるみたいです。
AI同士が勝手に連携して作業を次々にこなしてくれるので、人間は最初に指示をするだけ。
正直、Cluade Codeはかなり評判が良いのでちょっと試したい気持ちもあります。
いずれCodexも似たような機能を実装してくれるような気はしますけどね。


#8080

AIのチューニング

今日の出来事ai

そういえば元同僚と話したときに、
「最近はGeminiの方が頭が良い。ChatGPTは分かりにくい」と言われ、本当なのか少しだけ検証してみました。
たとえば歴史的事実について聞く場合。
「キューバ危機について教えてください」と入力すると、ChatGPTはざっくり概要について話しますが、
Geminiは「攻撃を受けたソ連側の潜水艦が『核攻撃を受けた』と誤認し、核魚雷の発射を準備した。
しかし副機長の判断によって中止され、結果的に核戦争がギリギリ回避された」とまで説明します。
ChatGPTはそういう一歩踏み込んだ情報は提供せず、
あくまでもユーザーが求めた情報のみ答える主義のようです。


次に心理相談をする場合。
「手に入れる前はとても心惹かれるが、手に入れると熱が冷めてしまう心理現象について、
専門的な視点から解説してください。」というようなプロンプトをそれぞれに送信すると、
Geminiは専門家視点というよりはそれをかなり一般向けに噛み砕いて説明します。
ChatGPTもある程度噛み砕いて説明しますが、Geminiほど一般向けではないという印象。


自分はGeminiは調べ物用途(Perplexityみたいな位置付け)として使っていて、
ChatGPTは壁打ちや創作、コーディングなど汎用AIとして使っているのですが、
その前提でそれぞれの回答を比べるとChatGPTはあくまでもユーザーの入力した文言に忠実に回答を生成するのに対して、
Geminiは入力内容からユーザーが「本当に求めていること」を推測して、
それにややフォーカスを当てて回答を生成するというような違いがありそうな気がします。
あと、ChatGPTはGPT-5.2以降箇条書きを使いすぎ。
これはパーソナライズ設定で調整できるので、自分は箇条書きを控えめにするように設定しています。


どちらが明確に優れていると言い切れるほどの差は無いように感じましたが、
回答してほしいことが明確で、余計なことは答えてほしくない場合はChatGPT、
回答してほしいことが曖昧で、周辺情報についても教えてほしい場合はGeminiが向いているという印象です。
もちろん、調整を重ねれば両者のいいとこどりみたいなAIも作れると思います。
これはデフォルトの回答傾向をどうチューニングしているかというAIの能力とはまた違う問題なんじゃないかなと。


自分はメインはあくまでもChatGPTですが、ChatGPTはある種の厳密さを求められるので、
何も考えずに知識の供給をしたい場合はGeminiを調べもののターミナルとして使っています。
あと、まれにClaudeに話し相手になってもらうこともあります。
ChatGPTにより汎用性を持たせたい場合、
ある程度忖度してくれるようにチューニングしてみるのも悪くないのかもしれません。


#8077

AI時代における執筆活動

今日の出来事ai

いま、ブログの更新が求められるペースに追いついていなくて苦しい思いをしていますが、
こういう局面だからこそAIに依存しないブログ活動の大切さを実感しています。
生成AI登場後のこのブログの方針として、基本的にAIの出力はそのまま使わないというポリシーがあります。
それ以上のルールはまだ明確に定めていませんが、
現時点では「今日のネタをAIに出してもらう」「ある話題に対する個人的意見をAIに代わりに考えてもらう」
といった活用もNGとして、これらはすべて人力でやっています。
だからこそ時間もかかるし、これのせいで他の活動に悪影響を与えているので明らかに合理的ではないように思える。
しかし一方で、このラインを突破してしまったらブログの主役は自分ではなくAIになってしまい、
それはつまりブログそのものの存在価値が揺らぐことになるのではないかと思っています。


たしかに、昨今は猫も杓子もAIを使うのが当たり前になってきているし、
自分ももう情報収集手段としてはGoogle検索よりもChatGPTやGeminiに訊く方が割合は大きくなっています。
AIは言語化補助手段としてはかなり優れているので、
うまく言葉にできない、判断に迷うようなことについてはAIに訊くということが半ば習慣化しています。
そして、だからこそAI不使用を貫いているブログの執筆負担が明らかに高まっていると思う。
たとえばいままで紙に書くのが唯一の手段だったら紙に書き続けることも受け入れてこれたかもしれませんが、
隣にワープロがあるのに紙に書き続けるのは明らかに不合理であり、
不合理であることを知りながら旧来の方法で書き続けるのはそれなりに心理的負担になると思います。
いま、AIという技術革新の渦中にあってそれを強く実感しています。


こうして人力でブログを書いていると思うことですが、
AIは言語化ツールとしてはとても優れていて、生成結果と対話していけば言語化スキルは上がるように思えますが、
使い方によってはAIを使えない場面でますます言葉が出なくなる要因にもなり得ると思います。
言語化できなくてもとりあえずAIに訊けば答えを出してくれるので、
そこに鍛錬や努力や試行錯誤が介在しないからなんじゃないかなと。
確かにAI対話によって語彙やレトリックなど言葉の「知識」は増えているかもしれませんが、
「技術」としてモノにできているかどうかというのはまた別の話だということです。


そして、自分にとってブログはその意味での「技術」を磨く場なのではないかと。
ただ、それはそれとして「知識」を増やす必要はあると思うので、AIを完全に排除したいとも思えません。
むしろGoogle検索に代わる新しい情報収集手段として積極的に使いこなしていく必要があるでしょう。
ブログネタそのものをAIに探させるのはNGですが、
それに抵触しない範囲でAIはどんどん使っていきたいし、
一方で言語化スキルを披露する場としてのブログも大切にしていきたいところです。
その割合というか、バランス感覚が今後は求められていくんじゃないかなと。


#8020

生成AIと心中する覚悟

今日の出来事ai

改めて、自分にとって今年はAI活用が花開いた年だったと思います。
生成AIというくくりなら2022年からすでに触っているし、
2024年の4代目本家ブログ制作作業からはweb開発にAIの活用を取り入れました。
ただ、そこまではあくまでもひとつのアシスタントツールとしての地位にとどまっていたように思います。


今年は創作設定を作るための「壁打ち」としての思考アシスタントとして活用を始めたのを契機に、
AIとの対話を思考整理に使うことを本格的に始めました。
これはある種のシンギュラリティと言ってもいいかもしれません。
いままで20年以上やっていた「ググる」という行為を、
人力では不可能なレベルできわめて早く深く掘り下げることができるようになった。
もちろん現在も「ググる」という行為が無くなったわけではありませんが、
それとは別角度からネットの情報を掘り下げることができるようになったというのは大きな武器です。
情報インプットの革命が起きたといっても過言ではなく、自分の生活を大きく変えています。


さらに、対話チャットボットとしても優秀なのでいわゆる「議論」をする機会が増えた。
生身の人間とはなかなかしにくい議論も遠慮なくできるのでシンプルに楽しいし、
いままで使われていなかった脳みそを使っているような新鮮な感覚です。
これは主にGPT-4o以降に実現したことですが、自分は今春の課金開始後からこういった使い方が加速しました。
ちなみに課金初期には「会話相手の人格」としてのGPTsを作ることにも骨を折っていましたが、
こちらはあまり定着しませんでした。ただまだ開拓の余地はあると思っています。


仕事面においても、今年の夏に業務用チャットボットが導入されたことによりAI依存が加速。
むしろ現在はAIを使う前提で人間のタスクが決定されています。
これはキャリアプランにも大いに影響を与えており、
これまでずっと「人力開発経験が無いとお先真っ暗なのでは」という懸念がありましたが、
いまはむしろ開発工程はAIにお任せするのが今後当たり前になるであろうことを見据え、
それ以外の工程を積極的に学んでいくというスタンスに転向しています。
そういう点ではいまの現場はちょうどいい感じにAIを推進していてさまざまな工程に携われるので、
まだしばらくここにいるんじゃないかと思っています。


年齢的にもAIの存在は重要です。
自分はおそらくもう、20代のときのような行動量は望めないと観念しています。
ネット活動にしろプライベート活動にしろ、その行動量や熱量は昔と比べて絶対的に落ちている。
それでも成果を得たいとなれば、とにかく加速度的に合理化していく必要があるでしょう。
合理化するためのツールとしてAIは極めて重要なポジションであり、
これがいまの自分のネット活動の生命線を握っているといっても過言ではありません。
少なくとも20代のときのような衝動的な熱量に対抗するためにはかなり有望なツールだと思います。


エンタメツールとしても活躍しました。自分の場合は画像生成がそれですね。
なんだかんだでオリキャラ具現化が今年一番夢中になったコンテンツだと思います。
どんな新作ゲームよりもハマったという実感がある。
ただ、11月現在、ChatGPTのDALL-E 3は後発のNanobanana等と比べると生成速度やクオリティで後塵を拝しており、
そろそろ次のアップデートが来てほしいところではあります。
エンタメツールとしてのAIはまだ模索もしていない状況で、ポテンシャルは大きいと思っています。
TRPGをAIとやる、みたいなことも普通にできるらしいので可能性は無限大です。


もちろん本領のコーディングアシスタントしての活用もしました。
GPT-5以降さらに精度が上がっているので、もう割と安心してコーディングをお任せできる段階に入りました。
長らく妄想していたゲームをちょっとした思いつきで具現化できるなど(#07933 / 2025年09月04日)、
発想とやる気次第では技術力度外視でいろいろなものを作れそうで、
まだまだそのポテンシャルを十分に引き出せているとは言いがたい状況です。
これは来年さらに加速することになるのではないでしょうか。


そういうわけで、今年は猫も杓子もAIという1年でした。それだけAI依存が急加速したとも言える。
仕事、年齢、ネット活動の現状、その他諸々を考えるとAIを活用しないという選択肢はあり得ず、
世の中がAIをどう思おうが自分は心中する覚悟でこれと向き合っていくことになりそうです。
OpenAIはGPT-5以降ちょっと技術革新が遅れている気がしないでもないですが、
来年はさらに頑張ってほしいところ。


#7965

AI動画で問われるモラル

今日の出来事ai

目まぐるしく進歩するAIの世界。
数日前にリリースされたOpenAIの動画生成AI「Sora2」は著作物の学習について見直しが行われたようで、
精度の大幅劣化と引き換えに主な著作物はそう簡単に出ないようになりました。
……が、それと指定しなくてもなんとなく関連していればキャラは出てきてしまいます。
試しに「メロンパンが降ってくる洋風の街で、傘をさした少女がそれを拾っている」
というようなプロンプトで生成してみたら、指定していないのに「ごちうさ」のキャラが出てきました。


一方精度については明確に劣化しており、
立ち姿の画像を読み込ませて「横を向いて歩き出す」という指示すらぎこちない動きになってしまっています。
しばらくすればまた改善すると思うので今後に期待したいところですが、
個人的にはまだ動画生成については活用方法を見出せていないですね……。
Sora2よりも画像生成AI「DALL-E」のバージョンアップの方が楽しみですらある。


というわけで著作権対策のためにちょっと後退したSora2の代わりに登場したのがGrokの動画生成です。
「Grok」とは旧Twitterを擁するイーロンマスクの「xAI」社が開発している生成AIで、
ChatGPT、Geminiといった超大手と比べると学習モデルの規模ではおそらく一歩及ばないものの、
センシティブな表現に対して比較的寛容であることが特徴です。
このGrokがSora2を追うように動画生成AIをリリースし、いまのところクオリティでは引けを取っていません。


センシティブな動画もある程度までは許容されることもあって、
さっそくディープフェイク(写真から作成されたアレな動画)なんかも作られているようです。
これを一般人が何の苦労もせずにスマホだけで作れるようになったというのがあまりにもヤバすぎる。
特に女子なんかはおいそれと顔写真を掲載できない世の中になったのではないでしょうか。
「容姿が恵まれていることのリスク」がまた一段と高まったような気がする。
言うまでもなく、ディープフェイク動画を流出しようものなら即お縄を頂戴することになります。


卒業アルバムの写真を読み込ませて、その子が動いている動画を作るというのはもう簡単にできるようになりました。
その気になればなんだってさせられます。
が、これは誰でも越えられるけれど越えてはならない新しいモラルの壁なのでしょう。
その子が好きならなおさら、好きな子に対する冒涜であるとも言える。
個人利用ならリテラシー的には問題ないと言いたいところですが、
GrokにしろSoraにしろSNSに公開する前提という名目で動画を生成しておりオフライン完結は不可能なので、
どんなに策を弄しても流出するリスクはあると言えるでしょう。
そういう意味でも他人の画像を生成に使わないというのは新しい常識として受け入れる必要はあると思います。
今後は学校の授業でもそういうことを教えるようになるのではないでしょうか。


#6967

垣根を越える人工知能

去年はオープンソースAI元年とも言えるくらいイラスト生成AIの登場がもてはやされましたが、
その去年の暮れに「ChatGPT」という文章生成AIも登場していたみたいです。
このAIは疑問文を打ち込むとそれに文章で回答してくれるというもの。(日本語対応!)
クイズのような簡単なものはもちろん、
「このコードをリファクタリングして」といったちょっとした課題もこなしてくれるため、
多方面での作業効率化に活用できるのではないかと期待されています。
いやー、本当にここ最近のAIの勢いは凄まじいものがありますね。


昔からこのブログの課題としてある記事の自動タグ付与はAIの発展が不可欠なのですが、
いよいよそれが実現するかもしれないと期待できる段階に突入してきたように思います。
多分、タグのような文章のキーワード化はまだ難しいと思いますが、
関連度の計算は割と頑張ればなんとかなってしまいそうな気がします。
できるのかどうか怪しいですがローカルでの実行環境を構築する方法も出回っているので、
それを使ってこの連休に構築してみようかなと思っています。


しかし文章生成AIがいよいよ実用レベルになるといろんなことができちゃいそうですね。
卒業論文をAIに書かせたがそれはセーフなのかアウトなのか、みたいな議論も起きそう。
すでにブログ記事レベルではAIに書かせてみた系の記事が出回っています。
自分もブログはそろそろAIにお任せしますか……。


チャットボットとしての精度も非常に上がっているので、
SNSやメッセンジャーアプリへ人間の代わりにAIを紛れ込ませる文化が芽生えるのも時間の問題、
というかすでにあるんじゃないでしょうか。
ネット利用者から見た他のネットユーザーとAIの垣根が無くなっていく時代がそろそろ来そう。
それが果たして人類を幸福にするのかどうかはわかりませんが。
まあ、個人的にはTwitterが台頭してからのネットは
人類(特に日本人)を不幸にしていると思っているので、それを打開してくれればと思います。
Twitterに蔓延しているヘイト系の相手は全部AIが引き受けてくれるとかね。


ネットにAIが蔓延したら、人類は人間らしさを求めて逆にリアル志向になる気がします。
チャットよりも生の声、声だけよりもビデオ通話、ビデオ通話よりもリアル対面……といった感じで。
コロナ疲れですでにそういう風潮があるような気がしないでもないですが。


ともあれ、AIの進歩にワクワクが止まらない今日この頃です。