郷愁は、いつも技術の一歩あとからやってくる
ComfyUIを入れた。
画像生成やワークフローの話を書こうと思っていた。
だが、気がつけば私は「曲」を作っていた。
それも、最先端のAI作曲というより、
どこか懐かしい、少し音の荒いバラードを。
最初は違和感だった。
音が粗い。解像度が足りない。
まるで12bit、32kHzあたりの感触。
ガチャガチャした曲なら気にならないのに、
静かなBalladになると、途端に“分かって”しまう。
──ああ、これは音質の問題だな、と。
だが、そこからが面白かった。
Hi-Fiの夢と、その先で起きたこと
CD (Compact Disc)が登場したとき、44.1kHz/16bitは「これ以上ない音質」だと思われていた。
理論上、人間の可聴域を完全にカバーしている。
もう十分。もう完成。
ところがDAT (Digital Audio Tape)が現れ、48kHzという数字を見せつけられたとき、
多くの人が理屈では説明できない違和感を覚えた。
「音が良くなった」というより、
「空気のつながりが違う」。
ただし、これは録音技術やマイク、回路、演奏環境が伴って
初めて体感できる差だった。
単にサンプリングレートを上げただけでは、解像度は上がらない。
DATは“録音できる価値”を訴求し、
一部のプロの現場では確かに使われた。
だが、一般には広く普及しなかった。
それは、体験としての物語が弱かったからだ。
AI作曲で感じた、意外な懐かしさ
ComfyUIでの作曲体験は、
ハイレゾの未来というより、
むしろアナログレコードの時代を思い出させた。
常に薄く鳴っている何か。
完全な無音がない空間。
音が空気に溶けて、輪郭が少し曖昧になる感じ。
それは音質が良いから心地いいのではない。
耳が安心できる文脈に戻ったからだ。
ここで腑に落ちた言葉がある。
DACを良くするんじゃなく、ミキサーを賢くする方向。
AI音楽は、まだHi-Fiを競う段階にいない。
情報量を増やすより、
欠けている情報を目立たせない工夫が効く。
これは、8bitや12bitの機材で音楽を作っていた頃、
人間が身につけてきた知恵と同じだ。
制約の中で、どう聴かせるか。
欠点をどう“味”に変えるか。
人間の感度は、いつも先に答えを知っている
人間は20kHz以上の音を聴いていない。
それでも、サンプリングレートの違いを感じ取る。
FPSも同じだ。
30fps、60fps、120fps。
数値が上がるにつれて、確かに滑らかになる。
だが、ある地点を超えると、
人は「滑らかさ」ではなく
違和感が消えたかどうかを見始める。
その先で起きるのは、いつも同じ現象だ。
Hi-Fiがインフラになり、
ローファイが表現になる。
性能競争が飽和したあと、
人は“崩し方”に美しさを見出す。
これは退化じゃない。価値軸の回転だ
AI作曲で感じた郷愁は、
懐古趣味でも、逃避でもない。
技術が一周して、
人間の感覚が次の遊び場を探し始めた結果だ。
DATがそうだったように、
AI音楽もまた、
「上位互換」を名乗るうちは本当の主役にはならない。
だが、
「ちょっと荒いけど、悪くない」
そう言われ始めた瞬間、
それは文化になる。
ComfyUIはツールだ。
だが、そこから生まれたこの体験は、
音楽と技術の歴史が繰り返してきた
人間側の感度の物語だった。
だから今日は、
使い方の解説を書くのをやめた。
代わりに、
この郷愁を書き留めておくことにした。
技術は、いつもあとから追いついてくる。
先に答えを知っているのは、
いつだって人間の耳なのだから。
ACE Step V1 で実際に作った曲
理屈はここまでにして、実物を置いておく。ACE Step V1で作った曲がこれだ。
・生成モデル:ACE Step V1
・作詞:ChatGPT 5.2
・長さ:2:29
・雰囲気:80’sローファイ寄り、ピアノとストリングス、甘い男性ボーカル。少しだけ“解像度の足りない”質感。
使用プロンプト
再現したい人向けに、実際に使ったプロンプトも載せておく。
条件付け
emotional lo-fi pop ballad, slow tempo, male vocal, warm and nostalgic, simple structure, gentle electric piano, soft pad, light drum, intimate, melancholic but hopeful, short song, catchy chorus, minimal arrangement, 1990s digital texture, slightly low fidelity, tender mood
歌詞
Title: “Low Resolution Heart”
Verse
The screen is glowing in the dark,
Like an old and faded star,
Every sound is slightly wrong,
But somehow feels like where you are.Pre-Chorus
I don’t need a perfect light,
I just need to see you there,
Even if the edges break,
Even if the world is bare.Chorus
In this low resolution heart,
I keep your shadow in my mind,
Not so clear, but still it’s true,
Every broken line is you.
In this low resolution heart,
We don’t need to be so smart,
If the signal falls apart,
I will stay where you are.Bridge
Maybe time will smooth the noise,
Maybe it will fade away,
But tonight this little song
Is enough for me to stay.Last Chorus
In this low resolution heart,
I keep your shadow in my mind,
Not so clear, but still it’s true,
Every broken line is you.
In this low resolution heart,
Even when the screen goes dark,
If the signal falls apart,
I will stay where you are.Outro
歌詞強度 : 0.9
使ってみた感想(この曲について)
- 生成時間は、ざっくり言えば曲の長さより短い。RTX3060 12GB でも、このクラスの楽曲なら待たされる感覚はほとんどない。
- ロング構成で日本語歌詞を投げると、どうしてもどこかで破綻する。ただ、短めの尺なら日本語でも十分に自然に歌ってくれる。
- 歌詞の分量と曲の長さのバランスが悪いと、途中でぶった切れることがある。構成と尺の設計は、思っている以上に重要だ。その時は”Latent”の秒数を調整して再生成だ。
- 今回はこの記事のテーマに合う歌詞を ChatGPT に頼んだが、正直、出来が良すぎて少し驚いた。曲の“質感”と、言葉の“温度”がちゃんと噛み合った。
- 高校生の頃、バンドブームの時代には、気になる相手にラブ・バラードを贈るなんて文化があった。いまなら、曲を作るのも、歌詞を書くのも、GPTと一緒にやればいい。しかも、PC一台で。
![CompyUI のワークフロー[ Latent ] で秒数を指定](https://b.aries67.com/wp-content/uploads/2026/02/image-13.webp)
簡単な使い方
以下は操作画面の例。
歌を歌わせたかったので、テンプレートから、「ACE Step V1 テキストからソング」を選択した。
音質は Stable Audio のほうが高いかもしれないが、やつは歌えない..

選択したら、すぐに実行可能なワークフローが現れる。
![Comfyの [ACE Step V1 テキストからソング]のワークフロー](https://b.aries67.com/wp-content/uploads/2026/02/image-9-1024x498.webp)
あとは、好みの曲調や歌詞を「Prompt」に入れて、「実行する」ボタンを押して待つだけだ。
モデルのDLも自動でやってくれる親切仕様。
![Comfyの [ACE Step V1 テキストからソング]のワークフロー画面のPrompt入力部分](https://b.aries67.com/wp-content/uploads/2026/02/image-11-598x1024.webp)
歌詞強度 0.99 は「歌詞を最優先させる」スイッチに近い。短い曲では武器になるが、長尺や構成が複雑な場合は、逆に途中で崩れたり、ぶった切れたりしやすくなる。


