トレンドニュースサイト STRAIGHT PRESS【 ストレートプレス 】

インフィニマインド株式会社

InfiniMind、シードラウンドで9億円を調達。大規模映像モデル(LVM)の開発を加速

このエントリーをはてなブックマークに追加

~現実世界のあらゆる瞬間を、人のように「見て、記憶し、解釈する」。独自の映像AIで、企業の映像資産を価値あるビジネスデータへ~

2026年2月10日 - エンタープライズ向け映像AIプラットフォームを開発するInfiniMind(本社:米国カリフォルニア州、日本拠点:東京都)は、UTEC(株式会社東京大学エッジキャピタルパートナーズ)をリード投資家とし、CX2 (Cox Exponential)、Headline ASIA Ventures、千葉道場ファンド、 a16z's scoutのエンジェル投資家からシードラウンドで580万ドル (約9億円) の資金調達を実施しました。調達した資金は、長尺映像の深層理解を実現する大規模映像基盤モデル「DeepFrame」の研究開発、エンジニアやビジネス開発人材の採用強化等に充当いたします。

[動画: https://www.youtube.com/watch?v=ZOj_c0CNP-w ]

[資金調達の背景と目的]
現在、世の中に流通するデータの80%は動画です。企業活動においては、メディア、店舗・工場映像、ドローン映像、衛星カメラ、防犯カメラ、携帯電話での録画など、長尺の映像データが日々爆発的に生成されています。しかしながら、その80%は未活用の「ダークデータ」と化している状態です。

LLMが「Text to Text」、従来のAIモデルが「短尺動画」の分析を対象としてきたのに対し、当社は創業当初よりエンタープライズ用途を見据えた長尺映像の深層理解に特化してきました。すでにメディアの分野では国内テレビ放送データを継続的にマルチモーダル解析処理するAIサービス「TVPulse」の展開に成功しており、大容量でかつ多様性のあるTVコンテンツを画像、音声に加えて映像内の「モノ、コト、概念」軸という新しい概念でAI解析、インデックス化することで、世の中の”今”を深く理解できる映像検索プラットフォームとなっています。

今回の調達によってこの「TVPulse」で培った解析技術を基盤としながら、次世代の大規模映像基盤モデル「DeepFrame」の開発をさらに推進させます。

[大規模映像基盤モデル「DeepFrame」について]
人類はLLM(Large Language Model)を獲得し、論理的思考力や知識の体系、概念の整理を情報空間において実現するに至りました。そして、音声認識(ASR)、映像認識(VLM)といったモデルの性能が向上するなか、LLMにこれらのモデルの出力を接続することで、AIに高度な感覚器官を持たせることに成功しました。しかし一方で、個別には最適化されたモデルであっても全体として十分な性能がでるとは限らないという懸念が示されてきています。

私たちは、これらのLLM・VLM・ASRを一つのパッケージとして開発し、全体として高い性能をだせる旗艦プロダクトとして「DeepFrame」を開発しています。またこの全体構造をLVM(Large Video Model)と定義し、LLMの進化先と意識して開発してきました。既存の基盤モデルでは対応が困難な「数時間以上」の例えば数週間、数ヶ月といった映像・音声データを統合的に処理し、時間軸や空間軸を超えて文脈や因果関係を深く理解することで、膨大な映像アーカイブを解析してビジネスに役立つ知見に変えたい、製造現場やセキュリティの文脈でリアルタイムに映像からアラートを取得したいなど、これまで実現が難しかった課題に対してDeepFrameが初めて対応できるケースが多く存在すると私たちは考えています。

主な特徴:
- 長尺コンテクストからその文脈、背景を推論: 数日から数週間、時には数ヶ月にわたる映像全体を解析し、単なるシーンの確認、認識に留まらず、時系列を遡り関係性を明らかにすることでストーリーを含めた「文脈」を理解します。
- 日本語と文化の理解: 映像に内在する表情、会話の「間」、文化的含意といった、形式知化が困難だった「暗黙知」をAIが構造化、新たな知的資産へと転換します。
- 実用性を重視したプラットフォームの構築: 各産業に最適化する仕組み、ファインチューニング技術(PEFT)をプラットフォームとして組み合わせ提供しつつ、多様なアウトプット形式に対応し、導入障壁の低いAIソリューションを提供します。

[コメント]
InfiniMind Inc. 代表取締役 カイ アバ
「"See beyond frames" というビジョンの下、我々は映像データの持つ無限の価値を解放することに挑戦してきました。すでにTVPulseで証明した10万時間を超える解析実績は、我々の技術がエンタープライズスケールで機能することの証です。しかし、これは序章に過ぎません。今回の強力な投資家の皆様のご支援を得て、我々は『長尺コンテクスト』というAIの最難関領域に挑み、DeepFrame LVMの開発を加速させます。企業の『暗黙知』を『形式知』に変え、あらゆる産業のオペレーションを革新するインフラとなるべく、チーム一丸となって邁進します。」

リード投資家
UTEC (株式会社東京大学エッジキャピタルパートナーズ), プリンシパル キラン マイソール | Kiran
Mysore
「日本は今、フィジカル空間とデジタル空間の交わる領域において、プロダクト開発の最前線に立っています。InfiniMindは、エンタープライズ向け大規模ビデオモデル(LVM)にとどまらず、拡張性の高いインフラ基盤や高度な文脈理解技術、直感的なインターフェースまでを一体として提供しています。これによりあらゆる映像を知的資産へと転換する「ユニバーサル・ビデオ・インテリジェンス」を実現しています。InfiniMindは、日本発の最先端イノベーションを世界に届け、グローバルに大きな価値を創出していく企業だと確信しています。」

【会社概要】
- 会社名: InfiniMind Inc(日本支社:インフィニマインド株式会社 (旧)SDio株式会社)
- 代表者: 代表取締役 カイ アバ
- 設立: 2025年8月
- 所在地: 214 Homer Ave, Palo Alto, CA 94301 USA
- 事業内容: 大規模映像基盤モデル、エンタープライズ向けAI検索プラットフォームの開発・提供
- URL: https://infinimind.io

【InfiniMindについて】
InfiniMindは、世界中に存在する膨大な動画データを、ビジネスで活用可能な「構造化データ」へと変換するAIインフラを構築しています。Googleで動画レコメンデーションの研究やデータサイエンスのチームを率いた経験を持つ創業メンバーを中心に、最先端の映像基盤モデル(LVM)の研究開発を行い、2024年11月に本格始動して以来、経済産業省の生成AI開発支援プロジェクト GENIAC第3期やGoogle、NVIDIA等の大手プラットフォームスタートアッププログラムへの採択、日本で2社のみとなるAWS GAIA 2025(Generative AI Accelerator)への選出、AWS Re:Invent 2025での単独セッション選出等、Deep Techの最前線から映像基盤モデルのグローバル・スタンダードを確立すべく、日本を拠点に世界市場の変革に挑んでいます。

現在エンジニアを中心に一緒に世界で闘う仲間を積極採用中です。Linkedin、または以下メール等でお問い合わせください。

本件に関するお問い合わせ先
Email: info@infinimind.io

企業プレスリリース詳細へ
PR TIMESトップへ

最新情報をTwitterで受け取ろう!
最新情報をFacebookで受け取ろう!
前の記事
一覧へ戻る
次の記事