知られざるエマヌエル・バッハ (C. P. E. バッハ) を紹介するこのサイトに関するブログです.
このサイトにある YouTube ビデオをどのようにして収集したかについてはまだ書いていなかったので,ここにかんたんに書いておきます.
下図に一部をしめしたように,まず YouTube から HTML のかたちでデータをダウンロードします.ここではシュパーニがアップロードしたビデオのリストをつかっています.これを Python で自作したプログラムによって,ブラウザで表示可能なかたち (下図) に加工し,作品番号をてがかりとして作品ごとにわけて,その作品の Web ページに挿入します.
作品ページには自動挿入した部分がわかるようにしておいて,挿入プログラムを反復使用してもビデオが重複しないように (ふるい部分は自動削除するように) しています.