【スクリプト配布】YouTube のチャットファイル(.live_chat.json)をニコニコのコメントのxml形式に変換するスクリプト【Python】

Python

更新日：2023年8月23日

YouTube のチャットファイル(.live_chat.json)をニコニコのxml形式に変換する関数を紹介します。

「好きな配信者のアーカイブ動画やチャットファイルをバックアップしておいたのはいいものの、チャットファイルの再生方法がわからない」という問題に当たったので作りました。

動画の一括保存方法はこちら。

推しの全動画を一括ダウンロードする【YouTube / yt-dlp / 鈴原るる】

説明

チャットファイルは、youtube-dlやyt-dlpなどでダウンロードした形式を対象としています。

YouTube のチャットファイルプレイヤーが見つからなかったので、似た機能であるニコニコ動画プレイヤーでチャットを再生できるように変換する関数です。
ニコニコ動画コメントプレイヤーには commeon などを利用してください。

ダウンロード

convert_chat_to_xml_ver1-0-3.zip

使い方

このスクリプトは元ファイルをいじるような処理はしませんが、万一データが消えても責任は取れませんので、実行前にバックアップは取っておいてください。

上のファイルをダウンロードして展開する。
1. convert_chat_to_xml.py というPythonファイルが1つ入っている。
コマンドプロンプトを開く。
下記のように、スクリプトの.pyファイルのパスと、対象の".live_chat.json"ファイルまたはフォルダーのパスを書く。
エンターで処理を実行する。
渡されたパス内にxmlフォルダが生成され、そこにxmlに変換したファイルが作成される。

実行コマンドの例

python "C:\Users\sdt\Desktop\test\convert_chat_to_xml\convert_chat_to_xml.py" "C:\Users\sdt\Desktop\test\_video\20200210 - #03【デモンズソウル】KUSA TABERURU！！！【鈴原るる_にじさんじ】 - [HZavcqYkXfo].live_chat.json"

仕様

処理中はログが表示されるので、進捗を把握できます。
現在実行しているアイテム名・現在の処理内容、終了した際の経過時間が表示されます。

タイムスタンプ・ユーザー名・コメント内容を取得して、ニコニコ動画のコメントファイルの形式でxmlを生成します。
それ以外の情報やスタンプなどは変換されません。

途中強制終了は、ウィンドウを閉じるか、Ctrl + Cを押します。

コメントプレイヤー

ダウンロード - commeon

作成したxmlファイルは、commeonなどのニコニコ動画コメントプレイヤーで再生できる。

commeonの場合、xmlファイルを動画ファイルと同じ場所に配置しておくと、動画を再生したときにコメントも自動取得される。

【commeon】コメント再生機能付き動画プレイヤー【ローカルでも再生可能】

ソースコード

# Convert chat to xml ver1.0.3
# 作者：Bookyakuno
# ウェブサイト：【スクリプト配布】YouTube のチャットファイル(.live_chat.json)をニコニコのコメントのxml形式に変換するスクリプト【Python】 – 忘却まとめ
#        https://bookyakuno.com/convert_youtube_chat_json_to_nico_xml/
#
# Convert youtube chat json to niconicko comment xml.
# YouTube のチャットファイル(.live_chat.json)をニコニコ動画のxml形式に変換する関数
# チャットファイルはyoutube-dlやyt-dlpなどでダウンロードしたものの形式で動きます。
# YouTube のチャットファイルプレイヤーが見つからなかったので、似た機能であるニコニコ動画プレイヤーでチャットを再生できるように変換する関数です。
# ニコニコ動画コメントプレイヤーには commeon などを利用してください。


# ■ 使い方
# コマンドプロンプトで、下記のように実行します。
# 渡されたパスがフォルダーの場合は、フォルダー内のjsonを一括処理します。
# 変換されたxmlファイルは、「xml」フォルダー内に保存されます。
#
# python "C:\Users\<USER_NAME>\Desktop\test\convert_chat_to_xml.py" "C:\Users\<USER_NAME>\Desktop\test\_video\20190530 - #05【悪魔城ドラキュラ】諦めない心ッ…！！鈴原るるは戦う！【鈴原るる_にじさんじ】 - [Sbh6TXCxs40].live_chat.json"

import datetime, json, sys , os, datetime, re

# 変換したいjsonのファイルパス
target_dir = sys.argv[1]


# jsonファイルの読み込み
def import_json(target_dir):
    path = target_dir
    json_open = open(path, 'r',encoding="utf-8")
    json_load = []
    decoder = json.JSONDecoder()
    with json_open as f:
        line = f.readline()
        while line:
            json_load.append(decoder.raw_decode(line))
            line = f.readline()
    return json_load

# タイムスタンプが0:00のようになっているので、全て秒に変換
def convert_timetext(time_text, user_name, text):
    time_l = time_text.split(":")
    if len(time_l) == 2:
        mini, sec = time_l
        hour = 0
    elif len(time_l) == 3:
        hour, mini, sec = time_l
    try:
        second = (int(hour) * 3600) + (int(mini) * 60) + (int(sec))
    except ValueError:
        print("ValueError  > %s「%s」" % (user_name,text))
        return "0"
    time_text = str(second) + "00"
    return time_text


# テキスト内の特殊文字を変換
def replace_text(text):
    text = text.replace("<", "&lt;")	# 小なりの記号。タグを表記したいときにも必要
    text = text.replace(">", "&gt;")	# 大なりの記号。タグを表記したいときにも必要
    text = text.replace("&", "&amp;")	# アンパサンド。実体参照で使うため、記号として表示するときに必要
    text = text.replace(" ", " ")	# ノーブレークスペース
    text = text.replace(" ", " ")	# フォントサイズの半分のスペース
    text = text.replace(" ", " ")	# フォントサイズのスペース
    text = text.replace("–", "-")	# フォントサイズ半分のダッシュ
    text = text.replace("—", "-")	# フォントサイズのダッシュ
    text = text.replace("'","&#039;")
    return text

# さんぷる
# <chat thread="1640883302" no="1" vpos="704" date="1000000012" date_usec="2" anonymity="1" user_id="hR1wp4m-xxIaU2RgsVMr4zPyzeU" mail="184" leaf="0" premium="1" score="0">うぽつですー</chat>


# コア関数
def convert_youtube_chat_json_to_nico_xml(target_dir):
    info_start_time = datetime.datetime.now()

    if os.path.isfile(target_dir):
        path_l = [target_dir]
    else:
        path_l = [os.path.join(target_dir,i) for i in os.listdir(target_dir)]

    for index,target_path in enumerate(path_l):
        if index == 0:
            print("Create 'xml' Folder")
            os.makedirs(os.path.join(os.path.dirname(target_path),"xml"), exist_ok=True)
        if not os.path.splitext(target_path)[1] == ".json":
            continue
        print("file_name",target_path)

        print("==================================")
        print("===> Run > %s" % os.path.basename(target_path))
        print("===> Start Import json")
        json_load = import_json(target_path)
        print("===> Start convert")
        # jsonの必要な情報を整形
        line_l = ["<packet>\n"]
        finished_l = []
        for index, item in enumerate(json_load):
            if not "addChatItemAction" in item[0]['replayChatItemAction']['actions'][0].keys():
                continue
            if not "liveChatTextMessageRenderer" in item[0]['replayChatItemAction']['actions'][0]['addChatItemAction']['item'].keys():
                continue
            render = item[0]['replayChatItemAction']['actions'][0]['addChatItemAction']['item']['liveChatTextMessageRenderer']
            #
            # ユーザーネーム
            if "authorName" in render.keys():
                user_name = render['authorName']['simpleText']
            else:
                user_name = ""
            #
            # テキストを整形(絵文字は別の模様。ここはまだ調整必要)
            text = ""
            if "text" in render['message']['runs'][0].keys():
                text = render['message']['runs'][0]['text']
            if len(render['message']['runs']) > 1 and len(render['message']['runs'][0]) >= 2:
                text += render['message']['runs'][1]['emoji']
            #
            # タイムスタンプ
            time_text = render['timestampText']['simpleText']
            time_text = convert_timetext(time_text, user_name, text)
            line_l += ["<chat vpos='%s' no='%s' user_id='%s'> %s </chat>\n" % (time_text, index , replace_text(user_name), replace_text(text))]
            finished_l += [1]
        #
        print("===> Finished items [%s]" % str(len(finished_l)))
        #
        # ファイルに書き込み
        print("===> Start write xml")
        line_l += ["</packet>"]
        new_path = target_path.replace(".live_chat.json","") + ".xml"
        new_path = os.path.join(os.path.dirname(new_path),"xml",os.path.basename(new_path))
        with open(new_path, mode='w',encoding="utf-8") as f:
            f.writelines(line_l)

        date_o = datetime.datetime.now() - info_start_time
        date_o_l = re.match("^(.+\.)(\d\d)\d\d\d\d$",str(date_o))
        date_o = date_o_l[1] + date_o_l[2]
        print("\n===> __Saved__ [%s]> %s\n\n\n" % (date_o,new_path))

    date_o = datetime.datetime.now() - info_start_time
    date_o_l = re.match("^(.+\.)(\d\d)\d\d\d\d$",str(date_o))
    date_o = date_o_l[1] + date_o_l[2]
    print("All Finished [%s]" % date_o)


# 実行
if __name__ == "__main__":
    convert_youtube_chat_json_to_nico_xml(target_dir)

アップデート履歴

ver1.0.3

2023-08-23

convert_chat_to_xml_ver1-0-3.zip

エラーが出て失敗することがある問題を修正しました。
- チャットコメントに絵文字情報がない場合があることが問題でした。

ver1.0.2

2022-01-03

convert_chat_to_xml_ver1-0-2.zip

フォルダ内の一括処理できるようになりました。
- 渡されたパスがフォルダーの場合は、そのフォルダー内の.jsonファイルを一括処理します。
- このスクリプトは元ファイルをいじるような処理はしませんが、一応実行前にバックアップは取っておいてください。
渡されたパス内にxmlフォルダーを作って保存するようにしました。
- 一括処理できるようになって膨大なxmlファイルが同じ階層に作成されてしまうため分類するようにしました。
実行時のログを表示するようにしました。
- 現在実行しているアイテム名・現在の処理内容、終了した際の経過時間が表示されます。
"authorName"がないとのエラーを修正しました。

ver1.0.1

2022-01-01

convert_chat_to_xml_ver1-0-1.zip

実行時にファイルパスを引数指定して実行できるように変更しました。
- ファイル内にパスを記述する必要がなくなりました。
特殊文字が原因でコメントの読み込みができない問題を修正しました。
一部記号はエスケープ文字に変換されます。

ver1.0.0

2022-01-01

convert_youtube_chat_json_to_nico_xml.zip

公開

あとがき

鈴原るるのアーカイブがついに全て非公開になってしまった。
動画は全て保存しておいたものの、ついに視聴する方法が自分のPC内でしかなくなってしまったので、ローカル環境でチャット付きで動画を再生する方法を模索した。

その他

その他の方法では、「Ragtag Archive」というサイトで、様々なVTuberの動画とチャットファイルがアーカイブされているので、もしかしたら自分の推しの動画がまだ見つかるかもしれない。

鈴原るる【にじさんじ所属】 - Ragtag Archive

-Python

: Blender内のテキストを翻訳する・CSVファイルから翻訳を読み込む【Blender / アドオン / Python】

-Python

scvファイルにまとめた翻訳テキストを読み込む方法を紹介する。

: modalで数字キー入力により値を設定する方法【Blender Python】

-Python

Blenderの基本機能のトランスフォームのようなmodalでは、数字や記号入力で値の指定や四則演算ができるようになっている。これを自作のmodalでも再現する方法を紹介する。コード数字・四則演算 …

: 【コレクションとビューレイヤーコレクションの違い】全ビューレイヤーコレクションを取得する再帰関数【Blender / Python】

-Python, その他

コレクションとビューレイヤーコレクションの違い、ビューレイヤーコレクションへのアクセス方法について説明する。問題提起コレクションの一部オプションは、ビューレイヤーごとの設定である(「ビューレイヤー …

: Workbench レンダラーでもFreestyleのメニューを表示する【Blender / Python】

-Blender, Python

FreestyleはWorkbenchレンダラーでも動作する。しかし、Freestyleのメニューが表示されない。この問題を解決する。 Workbenchレンダラーでは、Freestyleの色設定が反 …

: 【Blender / Python】アニメーションデータへのアクセス【ドライバー・アクション・NLAトラック】

-Python

基本ドライバー・アクション・NLAトラックなどのアニメーションデータへは、オブジェクトごとにアクセスできる。アクションは bpy.data.actions から直接アクセスできる。 context …

: 【Python】実用性の高いマテリアル関連のサンプルコード【Blender】- マテリアルの一括置き換え・001などの結合・空スロットを削除など

-Python

実用性の高いマテリアル関連のサンプルコードを紹介する。Blenderの標準機能では弱い一括操作系を、コピペですぐ使えるように書き残しておく。ここで紹介する機能は、自作アドオンの All Materia …

KEI より:

2022年1月3日 3:32 AM

記事の公開、本当にありがとうございます。以前のチャット保存の記事のお陰で保存をしていたので無事にチャット再生することができました。
年が明けて早々に彼女のアーカイブが消えてしまい落ち込んでいた所に忘却野さんのツイートを見かけ、実際に再生できた時にはとても救われた気持ちになりました。

お陰様でほとんどのアーカイブをチャット付きで再生できるようになったのですが、76本のファイルがエラーで変換できませんでした。
念のためリストアップしてあるのですが、流石にそれを全部こちらに貼るのは迷惑だと思うので明瞭な部分だけをお伝えしたいとおもいます。

19年が5本、20年が8本で21年に入ってから急激に増え、終盤の動画はほぼ全部が変換できませんでした。ポケモンやピクミン、帰ってきた魔界村も全てアウトでした。
そして、その殆どが最後の行に「KeyError: ‘authorName’」とありました。
例
Traceback (most recent call last):
File “D:\test\convert_chat_to_xml.py”, line 88, in
convert_youtube_chat_json_to_nico_xml(main_file_name)
File “D:\test\convert_chat_to_xml.py”, line 68, in convert_youtube_chat_json_to_nico_xml
user_name = render[‘authorName’][‘simpleText’]
KeyError: ‘authorName’

私はcmdやPythonといったものは全く扱えないのでこの情報が忘却野さんにとって有益なのか分からないのですが、せっかくやり方まで説明して頂いたのでせめてお返しできないかなと思いコメントさせて頂きました。不愉快にさせてしまったら削除してください。それでは改めて、本当にありがとうございました。

返信
- 忘却野より:
  
  2022年1月3日 8:08 PM
  
  バグ報告ありがとうございます。
  まだ一部しか変換していなかったので、対処しきれていない例外があったようです。
  修正・改善したver1.0.2を公開しました。
  自分の環境ではver1.0.2のスクリプトで鈴原るるの動画を全て変換できました。
  
  別途いただいたエラーの詳細コメントは長いので非公開もままにしておきますが、参考になりました。
  
  返信
KEI より:

2022年1月4日 12:52 AM

早速のver1.0.2公開ありがとうございます、私の環境でも全てのデータを変換することができました！
彼女のチャンネルの動画だけでなく、他のチャンネルでのコラボ動画も含めcommeonでチェックしましたが、全てのコメントが正常に再生されました。

私は彼女が引退してしまってからファンになったので、毎日アーカイブを見ていたのですがとても消化しきれる量でもなく、期限が来ても消えないよう祈ることしかできませんでした。残念ながら非公開になってしまいましたが、忘却野さんのお陰でこれからも当時の配信の雰囲気を楽しむ事が出来そうです。

年明け早々のお忙しい中、対応していただき本当にありがとうございました。それでは失礼いたします。

返信
嗚呼より:

2022年9月23日 8:08 PM

超超初歩的な質問で申し訳ありません。
【使い方】の
＞コマンドプロンプトを開く。
＞下記のように、スクリプトの.pyファイルのパスと対象の”.live_chat.json”ファイルまたはフォルダーのパスを書く。

でコマンドプロンプトを開いた際に
C:\Users\～>
とあり、サイト内で説明されている「実行コマンドの例」のようにフォルダパスをうまく貼り付けることができません。
どのようにすればコマンドプロンプトを開いた際の初期ディレクトリを「実行コマンドの例」のように何もない状態にできますでしょうか？

返信
- 忘却野より:
  
  2022年9月23日 10:37 PM
  
  それは、「コマンドプロンプトが今どの場所で動いているか」というだけなので、今回のような場合は無視して構いません。
  > より先にやりたい実行コマンドを入力します。
  
  例) python “convert_chat_to_xml.pyのパス” “.live_chat.jsonファイルのパス”
  実行コマンドの例の意味は、「Pythonで、.pyのスクリプトを実行し、そのスクリプトに.live_chat.jsonファイルのパスを渡す」という感じです。
  
  注意点
  ・パスは、絶対パスである必要があります。
  ・パスは、””で囲む必要があります。
  
  返信
  - 嗚呼より:
    
    2022年9月23日 11:26 PM
    
    早速のご返信ありがとうございます。
    youtubeの動画をcommeonで無事再生できました。本当にありがとうございます。
    
    また、Twitchで試したところ拡張子がそもそも違うようでrechat.jsonの場合はxmlに変換できなかったです。(ご存知かもしれないですが・・)
    youtube→live_chat.json
    Twitch→rechat.json
    
    返信
舵輪より:

2022年12月13日 5:17 PM

動画ダウンロードに当サイトを重宝させていただいています。
本ページで公開されているコメント変換ツールの実行時に関わる質問です。

一通りやり方を拝見したうえで実行しましたが、以下のようなエラーメッセージによりjsonファイルがxmlに変換されません。原因は何でしょうか。
(当方初学者のため初歩的な質問かもしれませんが、ご了承いただければと思います)

以下はエラー結果です。

F:\Youtube\youtubedl>python “F:\Youtube\youtubedl” “F:\Youtube\youtubedl\コメント.comments.json”
C:\Program Files\Python39\python.exe: can’t find ‘__main__’ module in ‘F:\\Youtube\\youtubedl’

当ツール(.pyファイル)及び対象のjsonファイルの保存場所は “F:\Youtube\youtubedl” で、入力したパスと保管場所に齟齬はないはずなのですが、回答いただければ幸いです。

返信
- 忘却野より:
  
  2022年12月14日 3:13 AM
  
  「convert_chat_to_xml.py」のファイルのパスをまず指定してください。
  jsonのファイルは”〇〇.live_chat.json”でないとできないかもです。(“〇〇.comments.json”のファイルは変換できるかわかりません)
  
  F:\Youtube\youtubedl>python “F:\Youtube\youtubedl\convert_chat_to_xml.py” “F:\Youtube\youtubedl\コメント.comments.json”
  
  返信
xk_ce より:

2023年12月17日 6:19 PM

はじめまして。いつもありがたく使わさせていただいております。
最近気が付いたのですが、抽出したコメントにおいて、メンバーシップ限定の絵文字(スタンプ)についてはどうも空白になるようです。
これについてはさすがに対策のしようがないですよね・・・？

返信
- 忘却野より:
  
  2023年12月18日 3:10 AM
  
  本文にもある通り、メンバーシップ限定スタンプは無理ですね。
  
  > タイムスタンプ・ユーザー名・コメント内容を取得して、ニコニコ動画のコメントファイルの形式でxmlを生成します。
  > それ以外の情報やスタンプなどは変換されません。
  
  返信
- 匿名より:
  
  2024年9月15日 12:35 AM
  
  commeonやjkcommentviewerが対応してきているので一応下記シンプルな仕様で抽出して表示できましたよ。
  :shortcut:
  
  返信
π より:

2024年2月16日 6:25 AM

Python のバージョンは決まっていますか？
3.7.9 なら動くけど 3.10.6 にしたら起動しません。

返信
- 忘却野より:
  
  2024年2月17日 3:43 AM
  
  特に決めてなかったです。作成時のPythonバージョンも覚えてないので……
  
  返信