AIツール

ComfyUIでFLUXモデルを試す

Black Forest LabsがリリースしたText to ImageのFLUX.1は、ベンチマーク(ELOスコア)で他の主要モデルよりも上回っています。今回ComfyUIのアップデートでFLUXがサポートされローカルでも簡単に試すこと...
AIツール

テキストプロンプトから音楽を生成できるモデル (Stable Audio Open)

Stable Audio Open 1.0は、リアルなボーカルは生成できませんが最大47秒間の可変長ステレオオーディオを44.1kHzで生成できます。ローカル環境でのインストールと生成を試してみてください。
AIツール

画像や動画の人物の表情をコントロールする (LivePortrait)

LivePortraitでは、ビデオから得られたモーション(顔の表情や頭のポーズなど)を使用して、リアルなビデオを合成することができます。
ソフトウェア

Windows上でUbuntuのストレージにアクセスする

Windowsを動かしている時に、Ubuntuのインストールされたディスクを繋いでファイルにアクセスする方法を紹介します。
AIツール

人間の3Dモーションを生成する (MoMask)

テキストからモーションキャプチャ (BVH)を生成することができるMoMaskを紹介します。
ソフトウェア

FFmpegをWindowsにダウンロードする

マルチメディアデータを処理するためのコマンドラインツールであるFFmpegをWindowsで利用できるようにする方法を紹介します。
AIツール

Stable Diffusion 3をローカル環境で試す

複数主題のプロンプト、画質、スペリング能力におけるパフォーマンスが向上したStable Diffusion 3を試してみました。今までAPIでの提供だったがローカルでも利用できるようになったので利用方法を紹介します。
ソフトウェア

リポジトリを特定のバージョンに戻す、最新に更新する

リポジトリの利用者側として、不具合などが起きた場合のバージョンの戻し方と修正された新しいバージョンへの更新方法を簡潔にわかりやすく紹介します。
AIツール

動画や音声に沿って参照画像を動かす (AniPortrait)

フォトリアリスティックなポートレートとオーディオに基づいて高品質な音声合成アニメーションを生成するAniPortraitについて紹介します。
AIツール

IC-Lightを使用して人物画像のリライティングを行う

ポートレートの背景置換と照明の調整を行いリアルな合成写真を生成することができるIC-Lightについて紹介します。