悩ましいタグ整理
Obsidianの「Tag Wrangler」というタグ整理プラグインを導入して本家ブログのタグを整理していました。
このプラグインによる整理の他にもPythonで一括置換スクリプトを作って、
3代目以前に作った「#0000『記事タイトル』20XX年MM月DD日」という記事リンクを
全部Markdownリンクに置き換えました。
これは先頭に半角シャープを含むため、Obsidian上でタグとして認識されてしまうのが厄介でした。
なので少なからずタグ一覧を汚染していたのですが、思い切って全部綺麗にしたというわけです。
2025年03月31日現在、タグの数は1,108個。
特殊タグを除く最多記事数は「webサイト更新作業」の219本となっています。
確か前回集計時点では「生活リズム」(現在187本)が1位だったと思うので追い抜いた形になります。
趣味関係は上記のweb制作が1位で、2位は「暗号資産」(131本)が急浮上。
2021年新設のタグとしてはぶっちぎりの使用回数だと思います。
ただしこのタグは後述の都合で今後分解される可能性があります。
趣味別3位はゲームタイトル別では不動のトップでもある「ピクミン2」(121本)。
しかしこれらを「意欲の問題」(134本)が追い抜いていて、
ブログとしては意欲に関する悩みが息の長いテーマになってきていることが窺えます。
これらタグは記事執筆後にその日のフィーリングで決めているようなところがあり、
もうちょっとカッチリとしたルールを決めたいというのはずっと前からある課題です。
だからこそわざわざ自然言語処理を駆使してまでタグ整理をしようとしているわけですね。
ただ、実際にこうして汚染された情報を除外して純粋な一覧を出してみると、
思いのほか自分の頭の中でもルールが確立していないことがわかります。
たとえば、ゲームは作品の内容に言及した場合はゲームタイトルをタグにして付与する。
これはまあ妥当だと思います。その「続き」がある可能性が高いですからね。
しかし、過去の自分は音楽アルバムについても同様に作品名でタグ付けしています。
これは妥当とは思えません。特定の音楽アルバムに複数回言及することは稀だからです。
音楽に関しては「ジャンル」がもっとも小さい単位のタグで良いような気がする。
とはいえ、こないだのSAW IIのように複数回言及するようなケースがまったくないわけでもなかったり……。
さらに悩ましいのは、漫画やアニメなどゲーム以外の娯楽です。
これらも音楽と同じように、基本的に鑑賞が終わってから感想を書くことが多いので作品別タグは不要な気がする。
しかし『ONE PIECE』のような長期連載の場合は複数回言及しているケースもあるし、
アニメもリアルタイム視聴するような場合だと作品別タグはあった方がいいような気がします。
「2回以上言及した作品のみタグ化する」というのが無難でしょうか……。
ゲームも1回きりの言及でタグとしての意味を成していないケースは結構ありますからね。
ただ、1回目では付けないが2回目の言及で付けるというのはルール化が難しいという実情があります。
そう考えると、とりあえず作品に言及したらそのタグを付けるという昔の自分の方針は間違っているとも言えないかも。
しかしそういうケースはまだマシで、抽象的な現象を取り扱うタグには定義が曖昧という問題を抱えています。
「生活リズム」と「生活リズムの問題」はどちらも100本以上の該当記事がありますが、
基本的にはどちらも睡眠に関する諸問題を取り扱ったもので、使い分けが曖昧です。
ざっくり言えば生活リズムのせいで困っている場合は後者を使うことにしていますが、
そんな使い分けがブログのタグ付けにおいて必要なのかという。これはマージしてしまってもいい気はします。
逆に、近年急浮上した「暗号資産」はざっくりすぎるため分解の必要性を感じています。
暗号資産(というのは法令上の名称で、本文中の名称は「仮想通貨」)についての話題と一口に言っても、
先物取引、ステーキング、Web3技術、ハードウェアウォレットと多種多様な話題があるわけです。
「ハードウェアウォレット欲しいな〜」という主旨の記事と、
「今日はこういう取引をしました」という主旨の記事が同じタグというのは無理があるような。
なので暗号資産というタグは分解して、せめて取引とそれ以外で分ける必要性を感じています。
また、実際にはこれですら氷山の一角で、中にはしっかり定義されているのに埋もれてしまい、
該当記事がたくさんあるのに使われていないようなタグもあるでしょう。
そういうタグの中でも用途が似たり寄ったりでマージできるようなものがあるかもしれません。
マージした上で全記事遡って新しい定義に当てはまる記事にタグを付けるのは大変な労力を必要とします。
こういうところまでフォローするとなると、やはり人力では厳しいという結論に至ります。
「〇〇という重要語が登場したら××というタグを付与する」
というようなスクリプトを組んで過去記事全部に適用するというのが無難だと思っていますが、
それが完成するのはいつになることやら。
まぁでも、ObsidianでMarkdownベースで管理するようになったこととChatGPTのおかげで、
ブログの過去記事整理はWordPress時代と比べると格段に快適になったと思います。
2022年以前の記事を公開できるのはまだ当面先だと思っていますが、この勢いならそこまで遠くないかも??