CloudFerro wprowadza platformę Sherlock udostępniającą modele GenAI dostosowane do lokalnych potrzeb

CloudFerro, dostawca chmury publicznej, poinformował, że opracował platformę Sherlock, która daje dostęp do zaawansowanych modeli sztucznej inteligencji, m.in. takich jak Bielik 11B v2.3 Instruct, zapewniając jednocześnie pełną kontrolę nad danymi i zgodność z lokalnymi regulacjami. To narzędzie zaprojektowano z myślą o organizacjach, które chcą wdrożyć AI bez konieczności zarządzania skomplikowaną infrastrukturą.

Platforma Sherlock udostępnia modele mające zastosowanie m.in. przy obsłudze wielkoskalowych analiz tekstu, takich jak przetwarzanie dokumentów, budowa systemów rekomendacyjnych, czy wsparcie systemów RAG (Retrieval-Augmented Generation). Sherlock bazuje na architekturze chmurowej, wyposażonej w wysokowydajne procesory GPU.

Bielik 11B v2.3 Instruct to pierwszy zaawansowany model językowy opracowany na bazie danych w języku polskim, który powstał we współpracy inicjatywy open-science SpeakLeash (Spichlerz) i Akademickiego Centrum Komputerowego Cyfronet AGH. Dzięki temu model umożliwia pracę z polskojęzycznymi dokumentami i danymi, rozumie lokalne niuanse i kulturową specyfikę komunikacji.

Model Llama 3.1 70B to z kolei największy i najbardziej zaawansowany model w ofercie, przeznaczony do złożonych, wielojęzycznych zadań wymagających głębokiej analizy i generowania treści. Oba modele można integrować i testować w aplikacjach AI, dzięki standardowemu API zgodnemu z OpenAI.

Platforma daje także dostęp do dwóch modeli do tworzenia numerycznej reprezentacji tekstu (z ang. text embeddings): BGE-Multilingual-Gemma2 i e5-mistral-7b-instruct, które umożliwiają tworzenie zaawansowanych systemów wyszukiwania semantycznego oraz analizę dużych zbiorów danych i mogą posłużyć do budowy systemu identyfikującego kluczowe podobieństwa między tekstami. Na bazie tej technologii mogą na przykład powstawać aplikacje typu chatbot lub wyszukiwarka, analizujące ogromne zbiory dokumentów.

Modele działają w zamkniętym środowisku, a dane użytkowników nie są wykorzystywane do trenowania ani przechowywane w systemie. To szczególnie istotne dla sektorów regulowanych, takich jak opieka zdrowotna, administracja publiczna czy bankowość, gdzie przesyłanie danych do zewnętrznych systemów chmurowych często stanowi barierę nie do pokonania – podkreśla Jan Szypulski, Product Manager w CloudFerro.

CloudFerro, we współpracy z Φ-lab, laboratorium badawczym ESA, wprowadziło także pierwsze globalne embeddingi AI dla obserwacji Ziemi (EO), które przekształcają ogromne zbiory danych satelitarnych w łatwe do analizy wektorowe reprezentacje numeryczne. Embeddingi (wektorowy opis obrazów przetworzony modelami AI) zyskują coraz większe znaczenie w obserwacji Ziemi. Mogą być wykorzystywane przez naukowców zajmujących się teledetekcją, analityków GIS oraz badaczy środowiska pracujących ze zobrazowaniami satelitarnymi i danymi geoprzestrzennymi. Dzięki przetworzeniu ponad 62 TB danych z programu Copernicus i wykorzystaniu zaawansowanych modeli AI, takich jak DINOv2, udało się stworzyć 200 mln embeddingów, które znacząco upraszczają i przyspieszają pracę z danymi w teledetekcji i zarządzaniu środowiskiem.

Stworzenie embeddingów dla obserwacji Ziemi jest wynikiem specjalizacji CloudFerro w sektorze kosmicznym. Firma dostarcza usługi chmurowe do przetwarzania i przechowywania wielopetabajtowych zbiorów danych satelitarnych z obserwacji Ziemi i jest głównym wykonawcą (prime contractor) realizującym kluczowe projekty dla Europejskiej Agencji Kosmicznej. Razem z partnerami z konsorcjum tworzy i obsługuje platformę Copernicus Data Space Ecosystem, która jest głównym punktem dostępu do danych programu Copernicus.

CloudFerro planuje rozwój platformy Sherlock, poprzez wprowadzenie kolejnych modeli językowych, funkcji generacji obrazów oraz rozwiązań wykorzystywanych w dziedzinie obserwacji Ziemi.