個人ブログと検索AI
ネット検索の代替として、議論の相手として、仕事のアシスタントとして、相談相手の友達のような存在として、
早くも生活に不可欠な存在になりつつある生成AI。
ChatGPTは執筆現在無料ユーザー向けにネット検索連携機能(ChatGPT Serach)は提供しておらず、
基本的に回答に使われるデータは少し前までの情報をチューニングしたものになっています。
それに対し、Perplexityなどのネット検索系AIはAIがネット検索を代行するため、
常に最新の情報が得られるという特徴があります。まあGoogle検索の新しい形と言っても過言ではないのですが、
いまのところハルシネーション(明らかな誤情報を事実のように話す現象)がわりと見られるため、
特にGoogle検索結果に付随して強制表示されるGoogle謹製のAI「Gemini」は不信感が募っている印象です。
検索AIが覇権を取るのはもう少し先になるんじゃないかなと。
ただこの検索AI、個人的にはワクワクする一方でかなり恐ろしさを感じています。
というのも、Perplexityでは「/site:domain.com」の形式で特定サイトに絞って質問することができます。
これを使うと自サイトの情報、例えばピクチャレ大会における最近の流行なんかも答えてくれる。
ある意味サイトを持っていて適切にクロールしてくれていれば
それだけでこちらは何もしなくてもサイト専用のAIができていることになり非常に強力なツールになり得ますが、
ブログを一般公開している自分からすると予期せぬプライバシー漏洩の原因にもなりかねないと思っています。
当然、このブログもPerplexityは把握しています。
現状まだクロールが不十分なので深入りした質問を投げかけても知りませんと返ってきますが、
ブログ本文を分析し、それに基づいてAIが回答する下地はすでにできていると言えます。
このまま公開運営を続ければ、AIにもどんどん知見が溜まっていきさまざまな回答ができるようになる。
自分は原則として個人情報などの公開したくない情報は直接的には書かないようにしていますが、
断片的にそれのヒントになるような情報は書いているかもしれない。
例えば卒業した学校の名前などは、
膨大なアーカイブから断片的なヒントをかき集めた上でネットの情報と照合すれば特定は不可能ではないと思います。
ただ、自分は学校名は公開したくないのでそこまで深掘りはしてほしくない。
これまではAIの登場を想定していなかったので「理論上不可能ではないが人力ではこれを使った特定はまず不可能」
と思われていたプライバシーの断片情報も探せば結構あると思われ、わりと危機感を抱いています。
webサイトをGoogle検索に反映させるにはbotによるクロールが必須ですが、
サイト管理者はクロールされるかどうかは選べるようになっています。
これと同じような選択の自由が、AIに関してもあって然るべきなんじゃないかと思った次第。
(もしかしてクロール拒否すれば検索AIの学習をシャットアウトできるのかも?)
それこそイラストの無断転載問題(#07639 / 2024年11月13日)にも通じる問題ですが、
個人ブログを公開運営している人なんてイラストレーターの規模からするとごく少数派でしょうし、
こっちが取り沙汰されるのはまだまだ先になりそう……。
自分みたいにアーカイブが膨大であるがゆえにAI検索によってプライバシーの問題が顕在化するなどというケースは
日本中探しても該当者は100人いるのかさえ怪しいですし。
いずれにしろ、この件とコンプラの問題を踏まえると2022年以前のアーカイブの再公開は一層難しくなりました。
なんなら公開運営を継続するモチベーションもかなり減りました。
とはいえ、自分の全アーカイブを知り尽くしたAIと話してみたい気持ちは正直結構あります。
ローカルLLMではお化けスペックのマシンが必要そうですが、NotebookLM辺りで実現できないだろうか??