Можливість набору даних
d-nvest — Можливість отримання набору даних Бази Знань
Великий набір даних Бази Знань від Virta, придатний для Документного Інтелекту та RAG.
Бал
79.9
Бал (0–100) поєднує зважені виміри — рідкість набору даних, цінність для навчання, попит покупців, сила доказів та право на ліцензування. 70+ означає готовність до угоди. Дивіться оцінені виміри нижче для детального розбору.Впевненість
92%
Дія
Угода про обмін даними
Рекомендована структура угоди для цього набору даних: Придбання (повний викуп), Ліцензія (платні права на використання), Угода про обмін даними (контрольований доступ, без передачі права власності), Партнерство (спільна розробка) або Програма анотації (маркування). Вибрано на основі власності даних, складності ліцензування та доступності.Ринок
Обсяг глобального ринку Інтелектуальної Обробки Документів оцінювався в 2,3 мільярда доларів США у 2024 році та, за прогнозами, зросте на CAGR 24,7% між 2025 та 2034 роками. [2]
Недавні датовані зовнішні факти, що спричинили цю можливість — перевіряється походження.
- 📰press2026-06-15
Avec Thales, Renault Group renforce sa présence sur le marché de la défense
journalauto.com ↗ - 📰press2026-06-12
Les équipementiers automobiles appellent à un renforcement de l’Industrial Accelerator Act
journalauto.com ↗ - 📰press2026-06-12
Chery France muscle sa direction pour soutenir son développement commercial
journalauto.com ↗ - 📰press2026-06-12
La Belgique approuve à son tour le système de conduite autonome de Tesla
journalauto.com ↗ - 📰press2026-06-12
Cédric Lacour et Gaël de Beauchesne, premières recrues de GAC Motor France
journalauto.com ↗
Lineage
Як було отримано цю можливість
Ланцюжок, орієнтований на сигнали, від початку до кінця: недавні зовнішні сигнали → кваліфікована ніша → визначений власник даних → перевірка сайту → оцінена можливість. Кожна можливість є пояснюваною.
Конкретні докази того, що ця компанія активно дбає про дані — чому вона готова до кімнати угод.
- 🔌Public API
Публічний API Virta для управління мережею зарядки та інтеграції даних
джерело ↗
Profile
Профіль набору даних
Тип
Набір даних Бази Знань
Модальність
Текст
Сектор
мобільність
Обсяг
Великий
Актуальність
В реальному часі
Рідкість
Висока (власницький)
Доступність
Частковий
Юридичний
Змішане володіння — чутливий до GDPR (перегляд PII)
Портрет покупця
Постачальники Document-AI / IDP
Virta володіє комплексним набором даних Бази Знань у модальності Текст, отриманим з її обширної діяльності платформи для зарядки електромобілів. Це включає технічну документацію, посібники з API, статті підтримки та операційні процедури, що робить його першочерговим активом для навчання ШІ Документного Інтелекту. Такий ШІ міг би автоматизувати підтримку клієнтів, покращити адаптацію розробників та витягувати інсайти для оптимізації управління платформою.
Глобальний ринок Інтелектуальної Обробки Документів, як проксі для цього випадку використання, оцінювався в 2,3 мільярда доларів США у 2024 році та, за прогнозами, зросте на 24,7% CAGR між 2025 та 2034 роками. [2] Незважаючи на складнощі доступу, такі як спільне володіння даними з Операторами Зарядних Станцій та висока чутливість GDPR через дані водіїв, цінність набору даних є величезною. Його унікальна специфічність до домену зарядки електромобілів надає рідкісну можливість створити високоспеціалізовану та цінну модель ШІ, що виправдовує зусилля з навігації необхідними фреймворками анонімізації та згоди. ⚠ Обережність (цінні дані, доступ для переговорів): Володіння даними є спільним з Операторами Зарядних Станцій (CPO), які використовують платформу.; Висока чутливість GDPR через місцезнаходження водіїв електромобілів та їхні звички зарядки.; Потребує складної анонімізації індивідуальних сесій зарядки та платіжних записів.; Дочірня компанія Northe збирає пряму телеметрію транспортних засобів через OBDII, що може мати інші умови згоди. · корпоративний: незалежний.
Scoring
Оцінені виміри
Пояснювані, засновані на доказах виміри (0–100). Радар показує інвестиційні осі.
Ці докази в сукупності підтверджують, що Virta володіє комплексним, власницьким набором даних Бази Знань, що охоплює складну екосистему зарядки електромобілів (EV). Цей набір даних включає технічну документацію API, посібники з продуктів, списки змін та статті підтримки. Для постачальників Document AI та Intelligent Document Processing (IDP) це рідкісне джерело специфічного для домену тексту, необхідного для навчання моделей розуміти унікальні формати документів сектору мобільності. На ринку, який, за прогнозами, зростатиме більш ніж на 24% щорічно, цей набір даних пропонує значну конкурентну перевагу для створення рішень документного інтелекту наступного покоління.
See dimension details ↓- Dataset Freshness82
в реальному часі/потоковий
Наскільки актуальними залишаються дані — дані в реальному часі/потокові оцінюються найвище, періодичні вивантаження нижче. - Training Value84
придатний для Документного Інтелекту
Наскільки корисні дані для цільового випадку використання ШІ — їх придатність для навчання моделі або тонкого налаштування. - Dataset Specificity100
домінуюча 'база_знань', сектор мобільність, 4 специфічні типи
Наскільки точно дані націлені на конкретну, важкозамінну область або завдання. Нішеві, чітко визначені дані оцінюються вище, ніж загальні. - Dataset Rarity70
власницькі дані домену (відкриті знижують рідкість)
Наскільки рідкісними та власницькими є дані. Унікальні дані домену оцінюються високо; загальнодоступні дані знижують оцінку. - Dataset Volume100
24 згадки доказів, явне згадування обсягу даних
Очевидний масштаб даних, виведений з кількості збігів доказів та будь-яких явних згадок обсягу. - Buyer Demand85
Попит зумовлений двома збіжними ринками з високим зростанням: ринок ШІ в мобільності, який, за прогнозами, зросте на 44,6% CAGR (2026-2035), та ринок Інтелектуальної Обробки Документів (IDP), як проксі для Документного Інтелекту, який зростає
Наскільки сильно розробники ШІ та компанії, ймовірно, захочуть ці дані, на основі ринкових сигналів. - Legal Accessibility60
відкритий/API доступ
Наскільки юридично легко отримати та використовувати дані — відкритий доступ/доступ через API оцінюється високо; PII або регульовані дані оцінюються низько. - Acquisition Feasibility68
висока складність, незалежний
Наскільки реалістично фактично отримати дані, враховуючи складність доступу та корпоративну структуру власника. - Evidence Strength100
9 типів доказів, 24 згадки
Наскільки вагомим є доказ того, що компанія володіє цими даними — різноманітність типів доказів та кількість збігів. - Right to License28
володіння=змішане, ліцензування=gdpr_чутливе
Чи може компанія законно ліцензувати дані — на основі власності та складності ліцензування. - Corporate Independence90
незалежний
Чи може власник вирішувати самостійно — незалежна компанія оцінюється вище, ніж дочірня компанія великої групи. - Data Orientation39
1 сигнал апетиту до даних (1 тип)
Наскільки активно компанія інвестує в дані, вимірюється за її сигналами попиту на дані (найм, продукти, API…). - Dormant Data Surplus92
надлишок=високий, 5 нещодавніх зовнішніх сигналів — власницькі дані, що перевищують вже монетизовані
Обсяг та цінність власних даних, якими володіє ця компанія, ПОЗА тим, що вона вже монетизує — неактивний надлишок, який ми можемо розблокувати. Компанія може продавати деякі інсайти І все ще володіти набагато більшим неактивним активом. - ICP Audit75
⚠ перегляд — Основний бізнес компанії полягає в продажу платформи управління зарядкою електромобілів (SaaS) та похідних інсайтів/аналітики через API, що є формою продажу інсайтів, тому це погано підходить. Проблеми: Основний продукт компанії — це система управління зарядними станціями (CPMS) під назвою Virta Hub, яка є програмною платформою для бізнесу для експлуатації мереж зарядки електромобілів; Virta явно пропонує 'Доступ до даних та аналітику' та набір API для клієнтів для інтеграції даних та функціональності Virta
Evidence
Докази та походження набору даних
Що доведені докази підтверджують, що компанія володіє — переформульовано для ясності та порівняно з ринком.
Downloads / exports
Це вказує на збір структурованих комунікацій щодо продуктів та матеріалів підтримки, таких як примітки до випуску, які ідеально підходять для навчання моделей щодо оновлень продуктів та документів для клієнтів.
Event streams
Це вказує на документацію, що описує протоколи даних в реальному часі, такі як OCPP, що є важливим для навчання ШІ розуміти технічні специфікації для потоків даних IoT та мобільності.
Industrial data
Це показує існування документації для складних промислових випадків використання, включаючи інтеграцію корпоративних систем (ERP, CRM) та управління енергією, що є нішею високої цінності для спеціалізованого документного ШІ.
API access
Це доводить існування структурованої документації, що деталізує основні можливості платформи, цінної для навчання моделей розбору специфікацій API та списків технічних функцій.
Knowledge base / docs
Це прямий доказ централізованого сховища технічних знань, включаючи посібники та списки змін, що є золотою жилою для навчання мовних моделей на складних статтях підтримки.
Developer portal
Це підтверджує формальний, добре структурований портал з розширеною документацією API, що надає високоцінний, реальний контент для навчання моделей розуміти технічні посібники для розробників.
Data-volume signal
Цей зразок описує політики доступу до даних та інтеграцію аналітики, надаючи текст, корисний для навчання моделей розуміти управління даними та інструкції з використання в посібниках користувача.
IoT / sensor data
Це доказ документації, що пояснює інфраструктуру IoT-даних компанії, що є критично важливим для навчання моделей розуміти контекст даних підключених пристроїв у технічних посібниках.
Geospatial data
Це вказує на наявність документації, пов'язаної з геопросторовою аналітикою, спеціалізованим доменом для моделей документного інтелекту, що зосереджені на послугах на основі місцезнаходження та логістиці.
Coverage
Scanned sources
Deliverable
Premium dataset report
Virta Knowledge Base — a Large knowledge base dataset (Text modality) in the mobility domain. Primary AI use-case: Document Intelligence. Market signal: Global Intelligent Document Processing market size was valued at USD 2.3 billion in 2024 and is projected to grow at a CAGR of 24.7% between 2025 and 2034. [2]. Investment score 79.9/100 (confidence 0.92). Recommended action: Data Sharing Agreement.