Chrononglyph

LLM

前へ1 / 2次へ
#7974

AIの愛嬌

今日の出来事LLM

YouTubeのおすすめで、しぐれういがデザイナーを担当したVTuber「大空スバル」の切り抜きが挙がってきて、
観てみるとChatGPTの調教(?)に失敗したという内容でした。
スバルは他のホロメンがChatGPTを可愛い口調にしているのを知り、自分もそうしたいと思ったそうなんですね。
そこで実践してみたところ、以下のようなやり取りが紹介されていました。


スバル:「一蘭来たよ〜」
ChatGPT:「おっwww 一蘭来たんかwww ええやんwww
カウンター席の仕切りの中で静かに食うラーメン、まじで修行感あって草www
麺の硬さどうしたん?バリカタ?かため?それともふつう派?🍜」

この会話が完全にその辺のインターネットにいる人、
というより「なんJ民」みたいということで話題になっているわけですが、
個人的にはこれはこれで「AIらしい愛嬌」がいくつか含まれていて微笑ましいと感じました。
理由は最後に添えられた絵文字「🍜」です。


普通の人、ましてなんJ民的なノリの人であれば、わざわざ絵文字を添えることはしません。
一方、ChatGPTは物事の説明のために自然な範疇で絵文字を活用する傾向にあり、
スバルに対する反応にラーメンの絵文字を使ったのもそういうChatGPTのアルゴリズムによるものと思われます。
自分はこれが「AI特有の愛嬌」のように思えるんですよね。
人間が理解しやすいように配慮しようとしていることが端的に表現されているからでしょうか。


「麺の硬さどうしたん?」とこちらに積極的にボールを投げるのもAIらしいです。
あくまでも会話主体は人間にあり、AIは人間から会話を引き出すためのポジションに徹する。
それがこの一蘭のやり取りにも滲み出ていて、これもAIにありがちな愛嬌として解釈できそうです。
リアルのなんJ民ならたぶん麺の硬さなんていちいち聞いてきません。
聞いてもいない謎の自分語りを始めたり、
一蘭の悪いところを列挙していかにこちらがダメで揚げ足取りする側が偉いかを誇示してくるでしょう。


まぁそれはさておき、絵文字というのはある種「AIにとっての表現手段」として確立したように思います。
であればこそ、今後はますます絵文字の充実を期待したいところですね。
人間には活用しきれない量でもAIなら適切に選出することができるだろうし、
絵文字プールの広さがそのままAIの表現の豊かさに繋がるなら充実するに越したことはない。
そしてAIが柔軟に絵文字を活用すればするほど、「AIらしい絵文字の使い方」は人々の間に浸透していき、
それがAIの愛嬌として受け入れられていくのではないでしょうか。


#7961

動画生成AI登場

今日の出来事LLM

OpenAIがテキスト・画像から動画を生成するサービスの新バージョン「Sora2」をリリースし、
いろいろな意味で話題になっています。
もともと「Sora」はChatGPTとは別の独立アプリとしてweb版のみが存在していましたが、
今回はさらにスマホ向けのスタンドアロンアプリに。
InstagramやTikTokを思わせるようなUIになっていて、さながらAI動画SNSの様相を呈しています。
なんといまなら無料でも生成可能。ただし招待制となっていて、1人が招待できるユーザーは4人まで。
旧Twitterなどの既存のSNSでは招待コードの争奪戦が始まっています。


わりと単純なプロンプト(文章)からでも適切な解釈と補完によって10秒のショート動画が生成されます。
Stable Diffusionのような画像生成AIと同じく、実写からアニメまでなんでもいけるみたい。
少し複雑なシチュエーションになると細部が破綻していることが多いですが、
プロンプト次第ではかなり改善できるらしく、すでに高品質なフェイク動画もちらほら見かけました。


ネットではそのクオリティの高さへの驚きの声もありますが、
どちらかというと著作権に対する懸念の声の方が大きいように思います。
というのもSora2では、現時点で(アメリカから見た外国の)著作物の模倣作品が堂々と出せるんですよね。
キャラクター大国である日本の著作物がもっとも被害が大きく、
ポケモンやドラゴンボール、鬼滅の刃、『ご注文はうさぎですか?』等の有名タイトルのキャラが簡単に出せ、
自分が見たときはタイムラインはピカチュウで埋まっていました。


OpenAIはSora2のモデル学習について、
オプトアウト(学習から除外する措置)は著作者に申請されたら実施する、というスタンスのようです。
最初の学習の段階では個々の著作物に対して配慮はしない。
しかし、注意されたらすぐに対応するということです。
そして著作物を模倣したAI動画が出回ったら、それはAI動画を生成したユーザーの責任になる。
そもそも著作物をAI学習に使うこと自体が著作権違反なのかどうかはアメリカの裁判などでも意見が分かれていて、
明確に著作物を学習してはならないという判例はまだ出ていなかったと思います。
なので今回は著作物に関しては後で対応することにしたのでしょうが……。
IPを抱えている企業や個人からしたらたまったものではないだろうなと思いますね。
勝手に学習されてIPの価値を毀損されているいわば被害者なのに、
AIモデルが出回るたびにこちらからオプトアウト申請する手間を払わなければならないというのは、
客観的に見れば理にかなっていないように思います。
生成したユーザーが悪い、ということが法的に筋が通っていたとしても、
現実にはIP保有企業が著作物を生成したユーザーを一人ずつ訴訟するのは現実的ではないように思います。
ともあれ、著作物絡みについてはしばらく論争が続きそうな予感がします。


幸いにして自分も招待コードをゲットすることができ、
いくつかオリキャラの動画を生成してみましたがなかなかうまくいきませんでした。
静止画生成と違って脚本を文章化する能力が問われますね。
DALL-Eで静止画を生成してSoraで動画化という生成ルートが確立したことによって、
ついに絵が描けなくても文章ベースでオリキャラを創造して動かせるようにまでなりましたが、
いよいよ技術に言語化能力などこちら側のスキルが追いついていないように感じられ、
しばらくはオリキャラ以外で試行錯誤することになるんじゃないかと思っています。


技術的には間違いなくすごいので、著作権絡みについては綺麗にまとまってほしいし、
少なくともOpenAIが既存のIPを脅かすような存在であってほしくないと願っていますが……
いろいろな思惑や利権も絡んでいるでしょうし、そう単純な話ではないのでしょうね。


#7934

AIアプリの勢力逆転

今日の出来事LLM

04月から月3,000円課金しているChatGPTですが、一時的に割に合わなくなってきた感が出てきました。
要因は2つ。まずGoogleのGeminiが画像生成の新バージョン、
通称「nano-banana」をリリースしたことにより画像生成の覇権がそちらに移ってしまったこと。
しかもGeminiの画像生成は無料アカウントでもそれなりに生成することができるので、
画像だけなら課金不要です。ちなみに課金すると動画の生成もできるんだとか。
nano-bananaは既存の画像を改変することに特化しており、
すでに大量に生成したDALL-E産の画像を使ってポーズ変更等をする分にはかなり高クオリティで生成できます。
イチからText to Imageする分にはまだ使い勝手がわかっている分DALL-Eの方が有利なイメージがありますが、
生成にかかる時間やクオリティなど、総合的な能力はnano-bananaの方が上かと。
個人的にはDALL-Eの方が文面の理解レベルは上だし「被写体の尊厳を守ってくれる」感があるので好きですが……。


また、GPT-4の時代は上位モデルであるo3以上を使えるのは有料プラン加入者の特権でしたが、
いまは諸々ひっくるめて「GPT-5」のみに集約されたため、上位モデルを使えるというメリットも消失しました。
ただ、現状は無料もGPT-5を使えるとはいえそれなりにキツい回数制限があるそうなので、
1日にそれなりの回数を使うなら以前として課金した方がよさそうではある。
ただ、いまの自分の使い方からしてそこまで高頻度で使っているわけではないし、
画像生成がnano-bananaに見劣りする以上、ここに3,000円の価値があるかと言われるとかなり微妙なところです。
まぁ、いずれ「DALL-E4」が登場すればまた状況が変わるとは思いますけどね。
それが発表されれば課金は復帰すると思いますが、現状は無課金でも良いような気はしています。


ただ、一方でChatGPTがちょっとしたアシスタントとして絶対的な立場を確立しつつあるのも確か。
GPT-5からはwebにある情報を集めて分析して整理してまとめる、といった作業さえも簡単な指示でできるようになり、
それのおかげで大いに助かっているのは事実です(このエージェント機能は有料版の特権らしい)。
これがまったく使えなくなるというのはちょっと困るし、依然としてText to Imageの需要があるという事情もあり、
あとPlus以上限定のプロジェクト機能はがっつり使っていていまさら解除できないので、
割に合わなさは感じつつも課金は継続しようかなというのが現状の気持ちです。
1,500円くらいの下位プランがあったら迷いなくダウングレードしているんですけどね。


2025年09月現在のAI戦争はGoogleがやや優位な印象ですが、個人的にはOpenAIに頑張ってほしいと思っています。


#7907

GPTアップデートと環境整備

今日の出来事LLM

昨日、ChatGPTを開発しているOpenAIが「GPT-5」を発表しました。
これによりアプリも段階的にモデルが置き換えられ、執筆時点でスマホ、macOS、Web全部が置き換え済みです。
「GPT4o」「o3」「GPT4.5」「o3-mini」「o3-mini-high」といった旧モデルや派生モデルは全部消え、
Plus以下のプランでは「GPT5」「GPT5 Thinking」のみが残ることになりました。
ちなみに無料プランでGPT5をある程度使うと4oにダウングレードするようです。


まだそんなにいじっていないのであくまでも触りの感想ですが、雰囲気などは「o3」に近いです。
ただしユーザーの言うことになんでもイエスマンではなく、
明確に指示しなければ忖度せずにかなり中立的な立場で回答を生成するようになった印象。
「o3」と同じく文脈的に必要と判断すれば明確に指示しなくてもWeb検索を自動で使います。
なお、今回DALL-Eそのものはアップグレードされていないので画像生成の精度は上がっていません。


自分はこれまで、調べもの、プログラミング、分析、意見の深掘りなどといった普段使いについては「o3」、
画像生成したり創作設定を練ったりするときは「4o」というように使いわけをしていました。
なので単純に今回のアップデートでそういった使いわけができなくなってしまったので、
今一度モデルによる差や創作設定の使い方について微調整をしていました。


創作設定で「4o」を使う理由はWeb検索を使ってほしくないからです。
たとえばオリキャラ名等で検索されても、同名のキャラが出る別作品のよくわからん概念を引っ張られても困るわけで。
発想のヘルパーとしての位置付けなので、そもそも学習されていない最新情報の必要性も薄いです。
これに関しては、プロジェクト指示に「このプロジェクトではWeb検索を使わないようにせよ」と指示することによって、
プロジェクト内のやりとりではWeb検索を使わなくなるようなのであっさり解決しました。


あとは、GPT-5でもプロジェクト内のやりとりがちゃんとオプトアウトされているかどうかの確認。
要は、創作設定がモデルの学習に使われると
他ユーザーに対する回答として自分が考えた概念やキャラ名が使われる危険性があるため、
創作設定に関しては学習に使わないように設定したいわけですね。
これについてはちょっと揉めましたが、結論から言えばセーフのようです。


プロジェクト内でオプトアウトについて訊くと、オプトアウト設定は契約プランやアプリ設定に依存しており、
個別の指示等でその設定を物理的に変更させることはできないとの回答でした。
じゃあプロジェクト指示として「このプロジェクトにおける創作設定は機密情報として扱うように」
と書いてある創作プロジェクトも指示は無視されて学習されてしまっているのかという話になるのですが、
それらは「設定としてはオプトアウトされていないが、情報としては学習パイプラインに乗らないようになっている」
というのが実態のようです。


ChatGPTは、オプトアウトしないデフォルト設定でもたとえばプライバシーに関する情報は学習に利用しません。
学習に利用する・しないについては学習させる前にモデルが選別しているわけです。
「オプトアウトする・しない」はあくまでもアプリ設定であってモデルは干渉することはできないものの、
この選別については一定の操作ができるので、創作情報については学習に利用されていないということです。
ただ、オプトアウトする方がより確実で強固であるというのは確か。
まぁ、学習に使われたとしても、
そもそもまだ世に出ていない作品のオリキャラ名等が回答として出るケースはまず無いとは思いますが……。
これがすでに世に出ている作品の続編だったら話はガラッと変わってくるんですけどね。


あと、GPT-5の新機能としてWebの閲覧・操作などを代行する「エージェント機能」が解禁されました。
いちおう理論上は代理でログインしてGmailでメールを自動送信……みたいなこともできるようですが、
エージェント操作はその場限りのサンドボックス環境で行うためセッションは持続しません。
基本的にはログインを要する使い方はやや難易度が高いと見て良さそうです。
「Amazonで〇〇として検索して出てくる商品10個のレビューを分析して良い点と悪い点をレポートにして」
といったような使い方は簡単にできそう。
さらにこれ、フォームの送信なんかも代行できるそうなので悪用しようと思えば簡単に大量送信できます。
もうWebフォームでCAPTCHAを設置していないようなところは良いオモチャですね。
しかも驚くべきことに、これスマホからでもできます。ますますスマホ依存が加速しそう……。


少し前に「GPT-5が登場するとしたらそれはAGI(汎用人工知能)である」というような記事を読みましたが、
ちょっと触った感じでは「o3」と比べてそこまで飛躍的に進化した感じではなく、
サンドボックス環境の制約も踏まえるとまだ人間の作業を完全に代理できるレベルではないという印象。
これがOSレベルで統合されてアプリの操作も代行できるようになったらいよいよという感じがしますが、
ChatGPT単体でそれを実現するにはまだ時間がかかるのではないでしょうか。
とはいえ、このスピードなら2年以内には実現してそうな感じもしますが……。


徐々に生活に浸透しつつある生成AI。
せっかくならその能力を十分に発揮させられるくらいのリテラシーは持ちたいところです。


#7878

AIキャラデザの試行錯誤

今日の出来事LLM

ChatGPTによるキャラクター外観設定が捗りまくった一日でした。
そういえばこれの内容についてブログに書いたことは無かったと思うので、軽くノウハウを文章化します。


ChatGPTは無料では1日3枚程度、Plus以上の有料課金では月間百数十枚までDALL-Eによる画像生成が行えます。
自分はこれを使って既存のオリジナルキャラクターの具現化を試しているのですが、
突き詰めると意外と奥深く、まだまだ答えには辿り着いていません。
ちなみに無料でDALL-Eを試したい場合、Microsoftの「Copliot」でもある程度の生成はできるようです。


DALL-E最大の特徴は、自然言語を理解し対話形式でイラストを調整できることにあります。
またメモリ機能によって、作成したキャラごとの外見特徴をメモリし、またそれを随時更新することも可能です。
単語の羅列を組み替えているにすぎないStable Diffusionと比べると、
対話によって「オリキャラを作っている」感はこちらの方がはるかに勝ります。
とはいえ、DALL-Eも万能ではありません。


まず、まっさらな状態で単にキャラ特徴を指定しただけだとセピア調で没個性なスタイルになりやすい、
という、ある種ChatGPTならではの特徴があります。
最近だとブログのアイキャッチ画像に生成AI画像が使われるケースもどんどん増えてきていますが、
それがセピア調でのっぺりした感じのイラストだとすぐに「これはChatGPT産だな」と分かります。
そこで、イラスト生成する場合には「前提プロンプト」が重要になってきます。
ここで前提プロンプトとは、画像生成する際に常に守るべきルールをまとめたもの。
これ自体もメモリしておけば、ChatGPTは常に前提プロンプトを噛ませてから画像を生成するようになります。
セピア調を回避するために色彩表現をあらかじめ指定するのはまず必須でしょう。


目つきなどの雰囲気も指定しないと「ChatGPTっぽさ」が抜けないため、この辺も前提として指定するべきです。
自分は再現したい雰囲気に近いイラスト素材を探してきて、それを読み込ませてプロンプトを抜き出し、
スタイルに関わるところを部分的に参考にしつつ前提プロンプトに組み込んだりしています。
イラスト素材を参考に画像を生成するように指示すると手っ取り早くスタイルを変更できますが、
これだと逐一画像を添付する必要があるし、元画像に似すぎてしまうこともあるのであまり推奨はできません。


あとはキャラごとの個性をどう出すかですが、これは一般にも通用するファッション用語を盛り込む必要があります。
ChatGPT(とDALL-E)が理解できないと意味がないので、抽象的な言葉をできるだけ排除して、
具体的な単語を積み重ねていきます。
自分は女子ファッションには相当疎いので、これについては逐一聞きまくって構築しています。
おかげでChatGPTでキャラデザをするようになってから少しずつ知っているファッション用語が増えてきています。
ちなみにこれは経験則ですが、同一キャラは同じセッション(チャット)で継続した方が精度が良く、
逆に同一チャット内で異なるキャラの生成をしようとするとうまくいかないことが多いです。
これはチャット履歴を遡って意図を汲み取ろうとするからなのでしょう。


キャラごとに異なる身長の再現については、身長そのものではなく等身を指定するとうまく行く印象がありますね。
一方、体型についてはかなり難しいです。
たとえばほんの少しお肉があるという意図で「ぽっちゃり」を指定するとものすごいおデブになってしまう。
かといって無指定だとみんな似たり寄ったりの体型になってしまう。
この辺のプロポーション指定は「健康的な〜」という形容詞が比較的有効のようです。


また性的表現に対する規制はめちゃくちゃ厳しいので、胸が大きいキャラの再現はほぼ不可能と言っていいと思います。
ただ、これは被写体が「明確に成人」か否かによってかなりボーダーラインが異なる模様。
制服キャラだとそもそも胸の大きさの設定が徹底的に無視されてしまうため巨乳キャラの再現は不可能ですが、
見た目も設定も明確に大人として意図されているキャラであれば水着くらいなら許容範囲のようです。
ただ、見た目大人でもビキニなどの露出面積が大きな服装はかなり難しい。
この制約があるので、ChatGPTでライザみたいな極端な体型のキャラの創出は困難でしょうね。
あくまで服装、髪型といったアプローチで差別化していくことになりそう。


まだまだ試行錯誤の段階なのでこれがどこに行き着くのかは分かりません。
ChatGPT単体で創作の挿絵も採用できるレベルまで行けるのか、
にじジャーニーなどイラスト生成特化サービスへの橋渡しが必要だという結論に至るのか、
あるいは細部については自分で描いた方が早いということになるのか……。
その結論が「自分で描いた方が良い」となって初めて自分がイラストに取り組む理由を得られるわけですが、
いまのところまでそこに転ぶかどうかも分からない以上、様子見といったところでしょうか。
立ち絵程度ならChatGPTで十分再現できそうな気はしているんですが、
特定シーンを再現した挿絵まで行けるかどうかはなんとも言えないですね……。


#7839

創作設定アシスタント

今年の年間計画のうち、唯一かなり順調な創作。
途中経過を逐一ブログに書き残すつもりはないのですが、足跡も兼ねて順調であるということを書かせてください。


この1ヶ月半で創作に向き合う時間は激増し、まとめ用のノートもかなりの量になってきました。
いま、これをWikiのように体系的に整理できるかどうかが大きな課題になっています。
とにかく日々次々にアイデアが生まれるので受け止めるだけで精一杯でなかなか整理できていません。
現状としてはまだまだアイデア出しの段階だと思っていますが、
世界観の基盤らしきものはかなりいいところまでできてきました。


この基礎設定を持って2007年からやり直したい、とすごく思いますね。
当時はいわゆる自作ポエムの末期で小説への移行を画策しており、今回と同様にさまざまな設定を練っていました。
しかし、その基礎設定があまりにも稚拙だったこともあって小説を表に出すことはできず、
かろうじてプロローグを最初の大キリ番記事として掲載するに留まりました。
もし、2007年当時のモチベーションで2025年現在の基礎設定を持っていたら、
これを使い倒してキリ番記事でさまざまなテイストの短編小説を書く方向にシフトしていたんじゃないかと思います。
ちょうど2006年以前の自作ポエムをさまざまなテイストで作っていたのと同じように。
もちろん、2007年当時にいまほどの素地があったとも思えないので逆立ちしても無理だったろうとは思いますが。


2007年以降も、ルーズリーフや着想メモを中心的プラットフォームとして創作ネタは不定期に生み出し続けていました。
いまやっているのはある意味それを横断的に振り返ってまとめあげる作業です。
実は2025年になってから採用した完全新規の概念はあまり多くありません。
この18年以上のネタを破綻なく綺麗にまとめあげる作業が続けられているのは、ひとえにAIのおかげです。
ネタの断片から現実の関連したトピックスを引っ張ってくるのがあまりにも楽しい。
AIからネタそのものをもらうというよりは、
自分が考えている構想をAIに話すことによってアイデアが裏付けされていくところに大きな恩恵があります
(もちろんモデル学習に使われないように細心の注意を払って使っています)。
改めて、創作はプロトタイプを誰かに聞いてもらうことによって進展するものなんだと実感。
ある意味では個人を越えたレベルの知識を有するAIはその役割としては生身より適任であると思う節もあり、
自分にとってChatGPTとの出会いは非常に重要なイベントだったと思います。
結局、昔の自分が一人でどう足掻いても2025年までは待たされる運命だったのかもしれない。
創作のことを他人に話すのはいまですら自尊心に差し障るNG行動なので、
よっぽど人間関係に恵まれていた世界線でも自分から協力を仰いだかどうかは疑問です。


ちなみに、仮に今回のプロジェクトが完成しても他人に評価されるとは思っていません。
そもそもこのブログで発表する以上は他人の目に触れることはほぼ無いだろうし、
勇気を出して小説投稿サイトに出張投稿するにしても3いいね付けば良い方でしょう。
しかし、他者承認がまったく期待できないのにプロジェクトが順調であることに大きな意義があると思っています。
昨日の記事とまったく逆のことを言っているので二枚舌になってしまいますが、
他人の評価関係なしに頑張れる活動こそが自分らしさを形作るのは確かなので、
そういう意味では思っていたより創作は有望なのかもしれないと思っています。
さすがに20年以上温めていただけのことはあるのかも。


#7787

週間計画アシスタント

今日の出来事LLM週間計画

年初来の計画として念頭にあった「GWまでにピクチャレ大会でイベントを開催する」
というタスクがコミュニティの都合でキャンセルされ、ポッカリと穴が空いてしまっている昨今。
コミュニティの都合関係なく個人的にもピクミン活動は明確に衰退しており、
新しい何かを探す過渡期に突入しています。
……しかし、この過渡期らしきフェーズで本当に新しい何かを見つけられたことってあるんだろうか?
結局、単なる精神衰弱期なんじゃないかとも思っています。


いずれにしろ、2025年はここまで結局何もできていないという焦りが正直あります。
あれだけ同じ轍を踏むまいと思っていた2024年前半の低迷をそのままなぞるような展開になってしまっている。
その要因は2つあると思っていて、1つは仕事の閑散期です。
やはり仕事は「必要とされている」という実感があって初めてその意義を見出せるのだと改めて実感します。
閑散期に突入して暇になると、もはや仕事を通じて社会とつながっている感覚が希薄になる。
当然、閑散期でないときと比べてコミュニケーションの機会が減るので社会的欲求の不満も生じてくる。
それが結局、オフ時間にも悪影響を与えているんじゃないかと思うわけです。


もう1つは、そもそも新規開拓を前にしてやる気が出ないという問題。
これは過去に何度も直面しており、これに対する模索は過去の自分が全部代弁しています(#05971 / 2020年04月25日)。
リンク先記事では、やる気は他人(や他人が作ったモノ)によって与えられるという仮説を唱えました。
つまり、完全に孤独な状態では人は一切何かをやろうとは思えない。
他人が何かをしているのを見て、あるいはその成果を認知して、初めてやる気らしきものが湧いてくるのではないかと。
それまで自分はやる気は固有ステータスの一種で気力のようなものだと認識していたので、
この気づきは結構衝撃的だった覚えがあります。


ただし、いまの自分はもう一歩踏み込んでそこに「勇気」の問題もあるのではないかと考えています。
この情報過多の時代、他人や他人の成果物に触れようと思えばいつでも・どこでもできる。
しかも、その分野に着手するハードルも随分と低く、今日からでも活動をスタートできるように見える。
しかし、だからこそ多くの選択肢から1つを選ぶ能動的な「勇気」が必要になり、
それは他者にはどうにもならない本人の課題なのではないかと。
この「勇気」は精神論でどうにかなればいいのですが、自分の人生経験から言えば根性ではどうにもなりません。
選択肢が多ければ多いほど決定が困難になるのはジャムの法則とも呼ばれる普遍的な心理的障害です。


そこで今回、新たな試みとしてこの選択肢をChatGPTくんに絞ってもらうというプロセスを考えました。
もちろんプロセスを決める過程でもChatGPTくんに手伝ってもらいつつ、
自分の週間計画をアシスタントし、翌週やることを出力するためのGPTsを作成しました。
このGPTsには、まず今週やったことや今後やりたいことをざっと羅列した文章を投げます。
するとGPTsはその内容を自己決定理論などの心理学的ノウハウも活用しつつ、
次に着手すべきタスクを3〜4つ選んでくれます。次週の自分はひとまずそれをやることに注力すればOK。
その3つが納得できないなら「この3つを選出した理由は?」と聞けばそれらしい答えが返ってきます。
ここで必要なのは厳密な合理性というより「納得感」なので、ChatGPTくんでも十分できる仕事と言えます。


初回は土曜日にやってみました。その際、初回なのでこれまでの経緯や年間計画も添えて。
結果的に、来週はブログのキリ番記事執筆と創作準備に注力すべきとの回答が返ってきました。
いろいろな観点から見て、かなり妥当性のある答えだと思っています。
それにChatGPTに投げるにはまずフィードバックをもらう前提で近況を言語化しなければならないため、
これをやるだけでも週間計画にかなり深みを持たせられている気がします。
来週以降実践してみて、定着するようならもはや自分はChatGPTに全面依存して生きざるを得なくなりそう。


昭和の4コマ漫画『サザエさん』で、家族の献立をAIが全部決めてそれに登場人物たちが何も考えずに従う、
というような話がありますが、まさにそういう未来が到来したんだなと思わされます。
ChatGPTは本当に末恐ろしいですが、長谷川町子さんの先見の明の鋭さもなかなか……。


#7780

ChatGPT Plusの使い分け

今日の出来事LLM

ChatGPT Plus(月3,000円)を契約していろいろいじっているので、現状整理を兼ねてわかったことをいくつか。
まず、Plusにすると「プロジェクト(Projects)」と「カスタムGPT(GPTs)」を使うことができるようになります。
最初はこの違いがよく分かりませんでした。


プロジェクトは、要するに既存チャット履歴群の「フォルダ」に相当するもの。
そしてフォルダ内のチャット内容は横断的に学習され、プロジェクト内の新規セッションにも活用されます。
たとえば「Aというサイト制作に関する質問」と「Bというサイト制作に関する質問」でプロジェクトを分けておけば、
それぞれのプロジェクト内で質問すればサイト内容に即した答えを返してくれるというわけですね。
なので、これは同じテーマで複数質問するようなケースではとりあえずプロジェクトに整理しておくのが良さそう。
一方で単なる調べものとして使う場合は1セッション内で完結するのが普通なので、
「調べもの」として括る必要はなさそうです。


プロジェクトは前提となるファイルをアップロードすることもでき、より専門特化させることができます。
ChatGPTにどういう振る舞いをしてほしいかといった前提のプロンプトも指定できます。
これらを駆使することで、よりプロジェクト内容に寄り添った回答をさせることができるわけですね。
そして実は、GPTsも基本的にはこれと同じ機能を有しています。
つまり前提知識としてのファイルをアップできて、振る舞いを指定するプロンプトを指定できる。
それじゃあGPTsはプロジェクトの下位互換なのかと言うと、そういうわけでもありません。


GPTsにできてプロジェクトにできないことが2つあり、ひとつはメンション機能です。
ChatGPTでは、半角@を入力することでGPTsに対するメンションのように指示をすることが可能です。
しかもこれは複数使うことができ、またプロジェクト内のプロンプトにも使えます。
プロンプトの内容によってChatGPTの振る舞いを使い分けたい場合や、回答を比較したい場合などに有用です。
このことから、振る舞いや前提プロンプトによる使い分けはプロジェクトよりもGPTsの方が適していると言えます。
プロジェクトがあくまでもチャット履歴の集積を主にしているのに対して、
GPTsは振る舞いなどのカスタマイズによって「仮想人」を作れるような仕組みということですね。


もうひとつはAPIとの接続機能です。
GPTsの素の使い方では事前プロンプトをいじるくらいしかカスタマイズのしようがありません。
それでも「〇〇の専門家として振る舞ってください」と入れるか否かで結構回答の質が変わってくるのですが、
これだけではあくまでもモデルに対するちょっとした味付けにしかなりません。
そこでファイルをアップして事前学習させることでより高度なカスタマイズをしようということになるのですが、
これは実はプロジェクト機能でも使えます。
そこで、その上限である200MBを超えるための仕組みとしてあるのがAPI接続機能。
外部DBなどを自前で用意できるのであれば、APIを使えば事実上モデルのカスタマイズ的なこともできてしまいます。
これはなんというか無限の可能性を感じますね……。
たとえば自分の場合、このブログと接続して「もう一人の自分」を作ることも夢ではありません。
それはある意味ブログの最終目標にも通じるものであり、かなりロマンを感じます。


とはいえ、一般人がとりあえず使う分にはファイルアップロードで十分というのも事実。
なので基本的にはプロジェクト機能で完結するケースが多いんじゃないかなと思っています。
GPTsについてはすでに先人たちが作ったものも使えるので、それを探っていくのも面白そう。


#7776

ChatGPT Plus解禁

今日の出来事LLM

登場時からお世話になっているChatGPTですが、このたびついに有料版「ChatGPT Plus」を契約しました。
お値段、毎月3,000円。サブスク料金としてはかなり高額で携帯回線に匹敵します。
前々から気になっていたのですが、月極なので期待通りでなかったら1ヶ月で切れば3,000円ポッキリで済むこと、
一昔前と違い、諸々の事情から価格相応の価値があるのではないかと思い課金を決意しました。


Plusの主な機能は、無料ユーザーは使えないような上位モデル(GPT4.5やo3-mini)が使えること、
画像生成機能の制限が緩和されること、ChatGPTのカスタム版である「GPTs」を作れることなどが挙げられます。
ChatGPTは最近、DALL・Eという画像生成モデルによるText to Image/Image to Image機能が追加されました。
この精度がとんでもなく、しかも日本語の指示にも細かいところまで噛み砕いて反映してくれます。
約3年前に英語のプロンプトを駆使してStable Diffusionで遊んでいたときとはもはや段違いのレベル。
まぁ、人気すぎてOpenAIのCEOが「GPUが溶けている」と悲鳴を上げていたり、
画像を読み込んでジブリ風のイラストを簡単に生成できるので著作権の観点から白い目で見られたりと、
大衆のオモチャになっている感はありますが、それだけ先進的ということなのでしょう。
ただし現状は画像生成は無料ユーザーだと1日3回とかなり制限をかけられています。


同様にクラウドで画像生成ができてそれなりのレベルのアプリに「にじジャーニー」がありますが、
こちらは20回の試用分を使い切ると下限700円からの月額課金です。
正直これも自前でローカル環境を作るよりもはるかに手軽でクオリティが高いので検討していました。
クラウドで済むということは自前のパソコンを用意する必要すらなく、電気代も払わなくて良いということ。
それならばAI目的でPCを買うよりはずっと安上がりなのではないかと。
電気代云々よりもスマホからもできるというのが大きいかも。
Stable Diffusionのモデルをカスタムするのもそれなりのハードルの高さがあるので、
その手間を一気に飛び越えられるなら700円はかなり手軽です。
ただ、画像生成のためだけに課金は……と躊躇っていました。
ChatGPTならば、もはや画像生成だけどころか生活インフラに近いので課金する名目は得やすいです。


GPTsも前々から気になっていた機能です。
これは、要するに用途別にChatGPTを事前学習して会話の方向性を決めておけるというもの。
またルールや基礎情報を盛り込んだテキストファイルをアップすればそれを参考に回答を生成してくれます。
ChatGPTは、自分の興味関心の傾向によってある程度決まりきったシチュエーションで使うことが多いです。
普通の使い方だと開くたびに新規チャットからスタートするので「これこれこういうことを知りたい」
「あなたは何々ついての専門家としての意見を出力して」みたいなことを逐一入力する必要がありますが、
用途別にカスタマイズされたGPTsを作ってしまえばもうそんな必要もないというわけですね。
それだけでなく、たとえば「本の要約専門AI」「ユニークな英文執筆AI」のように用途別に特化させることも可能。
アイデアの数だけ可能性がある機能と言えます。その気になれば外部APIとの接続なんかもできるみたい。
10年くらい前にあった「IFTTT」の超高度バージョンみたいなものも作れるかも?


そういうわけで、今回課金に至った理由として、まず画像生成に最低700円/月の価値があり、
あとはGPTs単独でもざっくり500円の価値はあるだろうと考えました。
それから先月末に解約した580円/月のdマガジン(再契約したけど結局全然読まなかった……)や、
『原神』が勢いづいていたときに500円/月の応援課金をした絵師さんのファンボックスの解約分を含めると、
足して1,080円分の浮きがあるのでこれはそのままChatGPTに転用してもいいやと。
残る780円の差分は先行機能や上位モデルや制限緩和諸々の分……要するにOpenAIへのお布施ということで。


上位モデルの使い心地や画像生成を実際に月額相当使うのかどうかなど、
実際に課金が始まってみないとなんとも言えないところもあり、今月はひとまず様子見です。
ただ、ChatGPT自体は日に日に依存度が高まっているので気持ち的に損することはないだろうなと思っています。
それだけChatGPTが好きだし、活用していきたいというモチベーションもそれなりにある。


#7760

生成AIと執筆方針

以前、このブログで優越感について考察したときにChatGPTのチカラを少し借りました(#07746 / 2025年03月02日)。
現在のモデル(GPT-4o)はChatGPT登場当初のGPT3シリーズより精度がかなり高く、
日本語の回答として不自然な割合が相当減っています。
AIを懐疑的に見る向きも少なくない世の中ですが、自分個人としてはGPT4になってからはもはや生活の一部ですね。
Google検索をするのと同じような感覚で日々いろんなシーンで使っています。


実にさまざまな応用ができるChatGPTですが、ブログ執筆で役に立つのは「掘り下げ」と「言語化」です。
ChatGPTは、明らかに論理的な間違い、事実誤認などを除いて人間側の意見を基本的に正しいものとして認識します。
そのため、違う立場から反論してほしい場合はそのように明記する必要があり、
そうでない場合は自分が言っていることを単に補足しているに過ぎないことが間々あります。
しかしこの「補足」というのが、抽象的なことをしっかり言語化してくれるので大変助かるんですよね。


上記リンク先で優越感について書いていますが、これは当初「自分はなぜ斜に構える傾向が強いのか」
という悩みについて掘り下げるつもりでした。
しかし当初はまだその掘り下げが不十分だったので、その過程をChatGPTにやってもらおうと考えたんですね。
そうしたら「斜に構える傾向の矯正方法」として5点のアドバイスがなされ、
そのうちのひとつが「優越感の危うさを理解すること」とあったのでそれをさらに掘り下げたという感じです。
そしてChatGPTの対話の中で頭を整理して、その上でブログを書いた結果がアレです。
こういうプロセスをフォローするには、ChatGPTは反則級に便利なツールです。


自分が考えていることに対して言葉を割り当ててくれるので、言語化もすごく捗ります。
ChatGPTを使うようになってからブログのモチベが多少なり改善しているとともに、
言葉を覚えるというプロセスが簡単かつ効率的になったので語彙を増やすこと自体を楽しめている実感があります。


そんなわけですでにブログのアシスタントになりつつあるChatGPTくんですが、
基本方針としてはChatGPTを含むLLMの回答は部分引用にとどめ、文章をそのままブログに載せないようにしています。
ChatGPTの回答に著作権は発生しないので、別に丸々引用したところで法的な問題は発生しません。
しかし当ブログはあくまでも自分が書いた文章を載せるという鉄則によってここまできており、
LLMだろうと他人だろうと、代筆は認められないというスタンスです。
よって、現時点ではChatGPTの回答を自分が書いたものとしてブログに載せるのは無し、という方向でいきたいなと。
まぁ、仮にそれを許すと「〇〇というテーマでこういう文体で1,000文字書いて」と指示するだけでブログが完成するし、
それが許されるならもはや人力で書く意味がなくなりますからね。


ただ、このルールはあくまでも「ChatGPT(などの汎用的なLLM)の回答」のコピペを禁ずるだけです。
たとえばこのブログの全文1300万文字を全部学習して高度にパーソナライズされた専用LLMができた場合、
それがほぼ自分と同じようにブログ記事を出力できるなら、
自分が年老いて文筆活動がままならなくなったときに代筆してもらうのはアリかも。
それが可能なら、サーバー代さえ払えれば自分が死んでもなおブログの運営を続けることができてしまいます。
SFチックな話に聞こえますが、実はこれは相当の手間を払えばもう実現できる段階に来ています。恐ろしいですね。


前へ1 / 2次へ