ちょっと前に形態素解析とマルコフ連鎖を使って新聞記事をリミックスする圧縮新聞を作ったんだけど、その少し後に今度は小説で同じシステムを使って、夢十夜Remixや圧縮ドグラマグラなどの小説のリミックスを作って、そのときに「これを使えば全く別の小説をミックスすることもできるな」と思った。で、こんなのを作ってみた。
2つの小説を形態素解析とマルコフ連鎖を使って単語単位で混ぜ合わせます。
テキストは大体青空文庫から取ってきています。収録したかったけど著作権が切れてなくて青空文庫に入っていないため入れられなかったのもあるのが残念(谷崎とか)。あと、個人的には旧字体や旧仮名遣いは好きなのだけど、ミックスするときに新旧混ざっているとうまくまざらないので、全て新字新仮名遣いに統一しています。収録したいけど青空文庫に旧字旧仮名版しかなくて外したのもあった。
1/11 23:50追記:ミックス元の文章に「圧縮新聞」も選択できるようにしました。