By Josh O'Sullivan, CoinTelegraph; Compiled by Whitewater, Golden Finance
Ether co-founderのVitalik Buterin氏は、新しい Token for theImage Tokenizer (TiTok)圧縮方式をブロックチェーンへの応用の可能性について支持した。
ソーシャルメディア・プラットフォームのTikTokと混同しないように、新しいTiTok圧縮方式は画像のサイズを大幅に縮小し、ブロックチェーン上での保存に適したものにします。
Buterin氏は、分散型ソーシャルメディアプラットフォームFarcasterでTiTokのブロックチェーンの可能性を強調し、「320ビットは基本的にハッシュです。320ビットは基本的にハッシュです。
この開発は、プロフィール写真(PFP)や非均質化トークン(NFT)用のデジタル画像の保存に大きな影響を与える可能性がある。
TiTok画像圧縮
TiTokはByteHopperとミュンヘン工科大学の研究者によって開発され、画質を失うことなく、画像を32の小さなデータチャンク(ビット)に圧縮します。
高度な人工知能(AI)による画像圧縮により、TiTokは256x256ピクセルの画像を「32個の離散したトークン」に圧縮することができる、とTiTokの研究論文は述べています。
TiTokは1次元(1D)画像トークン化フレームワークで、「2Dトークン化手法に存在するグリッド制約を破り」、より柔軟でコンパクトな画像を生成します。画像を生成します。
"その結果、競争力のある生成品質を達成しながら、サンプリングプロセスを大幅に高速化することができます(例えば、DiT-XL/2の410倍高速)。"
。
画像圧縮サイズの比較を示すTikTokの研究論文。Credit: TikTok
Machine Learning Images
TiTok は機械学習と高度な人工知能を活用し、変換器ベースのモデルを使用して画像をトークン化された表現に変換します。
このメソッドは地域的な冗長性を使用します。つまり、画像のさまざまな領域で冗長な情報を識別して使用し、最終製品の全体的なデータサイズを縮小します。
"生成モデリングにおける最近の進歩は、高解像度画像の効率的な合成における画像ラベリングの重要な役割を浮き彫りにしています。"
研究論文によると、TiTokの "コンパクトなポテンシャル表現 "は、"従来の技術よりも効率的で効果的な表現 "を生み出すことができます。
TiTokフレームワークを使用した画像再構成(a)と生成(b)の説明図(c)。出典:TiTok
TikTok, not TikTok
名前が似ているにもかかわらず、ソーシャルメディアプラットフォームのTikTokはブテリンによって承認されていません。
イーサの共同創設者は、TikTokのブロックチェーンの可能性を強調し、AIを利用した新しい画像圧縮方法に信頼性を加えました。
"画像のポテンシャル空間を2D格子として扱う既存の2D VQモデルとは異なり、私たちは画像を1Dポテンシャルシーケンスとしてラベリングする、よりコンパクトな式を提供します。"
提案された新しい方法は、「2Dマーカー」よりも「8~64倍少ないマーカーで」画像を表現することができ、研究チームは、この研究が「より効率的な画像表現への洞察」を提供することを期待している。研究チームは、この研究が「より効率的な画像表現への洞察」をもたらすことを期待している。