2025-04-13 縦書き日本語OCRツール調査 縦書きの現代日本語のOCRツール比較。 ※マンガよりもきれいに整列され、文学小説よりは背景など文字以外の情報もあるビジュアルノベルのような画像が対象。 続きを読む
2025-03-03 音声コンペ勉強記録 + signate 音楽ラベリングLB 0.812解法(7位、2025年3月時点) 機械学習の勉強の一環として、signateの音楽ラベリング練習問題に取り組みました。曲の最初の30秒から曲のジャンルを予測するコンペです。 signate.jp 音楽分類は初心者でしたが、LLM達*1に聞きながら1週間程度取り組んだ結果、7位(/201人)になったので学習の記録として残しておきます。 *1:mercury coder, deepseek-r1, grok3, claude 3.7 sonnet, gemini 2.0 flash, perplexity, chatgpt 4o 続きを読む