monaltro . pl
← Dziennik
Sztuczna Inteligencja 28 maj 2026 · 11 min czytania · Zespół Monaltro

Automatyczne notatki ze spotkań z AI — co działa dla polskiej firmy w 2026

Google Meet transkrypcja nie obsługuje polskiego. Teams Copilot obsługuje, ale kosztuje 18 EUR/user/mies. Porównujemy Fireflies.ai, tl;dv, Tactiq i własny pipeline z Whisper — co wybrać i od czego zacząć.

Google Meet transkrypcja nie obsługuje polskiego. Teams Copilot obsługuje, ale kosztuje 18 EUR/user/mies. Porównujemy Fireflies.ai, tl;dv, Tactiq i własny pipeline z Whisper — co wybrać i od czego zacząć.

Każde spotkanie kończy się podobnie: ktoś pyta „kto napisze notatkę?“. Ten ktoś spędza następne 20–30 minut na odtwarzaniu z pamięci tego, co przed chwilą omówiono — a i tak część ustaleń ginie w niedokładnym streszczeniu. W firmie robiącej 3–5 spotkań tygodniowo to 1,5–2 godziny powtarzalnej pracy administracyjnej każdego tygodnia, którą AI może przejąć bez specjalistycznej wiedzy programistycznej.

Problem pogłębia się, gdy notatki robi inna osoba na każdym spotkaniu — format, poziom szczegółowości i zawartość action items są za każdym razem inne. Trudno budować historię decyzji, gdy połowa jest w Slacku, ćwierć w e-mailach, a reszta tylko w głowach uczestników.

W 2026 roku narzędzia do automatycznej transkrypcji i podsumowań spotkań weszły w dojrzałą fazę. Wiele z nich obsługuje polskie spotkania, ma sensowne plany darmowe i integruje się z narzędziami, które prawdopodobnie już masz: Teams, Google Meet, Slack, CRM. Wdrożenie trwa zwykle kilkanaście minut — nie dni.

Jest jednak kilka pułapek, które potrafią zepsuć wdrożenie zanim się zacznie. Jedna z nich dotyczy bezpośrednio polskich firm korzystających z Google Workspace.

Pułapka: Google Meet nie przetworzy Twoich polskich spotkań

Spora część właścicieli firm korzysta z Google Workspace Business Standard lub Plus — planów, które oficjalnie zawierają AI i Gemini. Logiczny wniosek: „skoro płacę 63 PLN miesięcznie za użytkownika, powinienem mieć wbudowane AI notatki w Meet”.

Problem polega na tym, że Google Meet transkrypcja i funkcja „Take notes with Gemini” obsługują tylko 8 języków: angielski, francuski, niemiecki, włoski, japoński, koreański, portugalski i hiszpański. Polskiego na tej liście nie ma.

To nie jest tymczasowe ograniczenie ani błąd konfiguracji. Wbudowana transkrypcja Google Meet nie rozumie polskiej mowy, a Gemini generuje notatki właśnie na podstawie transkryptu. Jeśli Twoje spotkania wewnętrzne prowadzisz po polsku — a zdecydowana większość wewnętrznych spotkań w polskich firmach tak wygląda — wbudowane AI notatki Google Meet po prostu nie zadziałają, mimo że technicznie masz do nich „dostęp” w ramach płaconego abonamentu.

Warto to zweryfikować zanim uznasz, że temat automatycznych notatek masz już ogarnięty. To jeden z częstszych błędów przy ocenie, które narzędzia AI „mam w pakiecie” — podobne ograniczenie językowe dotyczy też automatycznych napisów na Google Meet, gdzie poprawne polskie rozpoznawanie mowy jest dostępne, ale osobna funkcja Gemini notatek już nie.

Dobra wiadomość: problem ma proste obejście. Zewnętrzne narzędzia, które opisujemy w kolejnej sekcji, działają na Google Meet i nie mają tego ograniczenia.

Microsoft Teams Copilot — działa po polsku, ale policz koszty

Microsoft poszedł odwrotną drogą. Copilot Facilitator — agent AI w Teams — obsługuje język polski i może działać bez konieczności nagrywania całego spotkania. W praktyce oznacza to, że uczestnicy nie muszą wyrażać zgody na zapis dźwięku, żeby po spotkaniu mieć automatyczne podsumowanie.

Copilot Facilitator w działaniu:

  • generuje notatki w czasie rzeczywistym, aktualizowane na bieżąco podczas rozmowy
  • wyciąga zadania (action items) i podsumowuje podjęte decyzje
  • odpowiada na pytania uczestników podczas spotkania (np. „przypomnij co ustalono w poprzedniej agendzie”)
  • przechowuje wynik w Microsoft Loop — stronie edytowalnej przez wszystkich uczestników spotkania, zsynchronizowanej z Teams i SharePoint

Copilot działa też z Outlook — zaplanowane spotkanie trafia automatycznie z notatkami do kalendarza. Dla firmy, która ma Teams jako centralny hub komunikacji, integracja jest faktycznie bezszwowa: zaproszenie → spotkanie → notatka → loop — wszystko w jednym ekosystemie.

Jeden ważny niuans: Copilot Facilitator działa tylko w spotkaniach zaplanowanych z kalendarza. Szybkie rozmowy Teams (Meet Now), spotkania w kanałach i call’e 1:1 nie obsługują agenta. Jeśli większość Twoich spotkań odbywa się właśnie w tych formatach, Copilot nie rozwiąże problemu.

Ostrzeżenie: Microsoft 365 Copilot wymaga osobnej licencji — ok. 18 EUR/użytkownik/miesiąc ponad koszt istniejącego planu Teams lub Microsoft 365 Business. Dla 5-osobowego zespołu to 90 EUR/mies. za AI notatki. Zanim zainwestujesz, sprawdź zewnętrzne alternatywy z kolejnej sekcji — nierzadko wystarczą i kosztują ułamek tej kwoty. Szersze porównanie Copilota z Google Workspace Gemini pod kątem całego pakietu AI opisaliśmy w poprzednim artykule.

Zewnętrzne narzędzia — i dlaczego warto zacząć od darmowych

Dla zdecydowanej większości polskich MŚP lepszym punktem startowym są zewnętrzne narzędzia do transkrypcji. Działają niezależnie od platformy konferencyjnej (Teams, Google Meet, Zoom), obsługują polski i mają sensowne plany darmowe. Dołączają do spotkania jako bot-notatnik lub działają jako rozszerzenie przeglądarki — bez instalowania czegokolwiek na serwerze.

tl;dv — darmowy, bez limitu spotkań

tl;dv oferuje plan Free Forever z nieograniczoną liczbą spotkań, nagrań, transkrypcji i podsumowań AI w ponad 30 językach — w tym po polsku. Punkt startowy bez żadnych kosztów, który pozwala sprawdzić, czy automatyczne notatki faktycznie wchodzą do codziennego workflow firmy, zanim zapłacisz choćby złotówkę.

Darmowy plan nie obejmuje zaawansowanych integracji z CRM (Salesforce, HubSpot) ani analityki rozmów sprzedażowych. Dla wewnętrznych spotkań operacyjnych i spotkań z klientami, gdzie zależy Ci na podsumowaniu i action items — bez ograniczeń przez długi czas.

Fireflies.ai — najgłębsze integracje z CRM

Fireflies.ai integruje się z ponad 40 systemami, w tym Salesforce, HubSpot, Pipedrive i Slack. Dla firm sprzedażowych to istotna różnica: notatka ze spotkania klienta trafia automatycznie do CRM jako aktywność, bez ręcznego przepisywania. Możesz też przeszukiwać całą historię transkrypcji spotkań pełnotekstowo — przydatne, gdy chcesz wrócić do tego, co dokładnie ustalono trzy tygodnie temu.

Ceny Fireflies.ai (rozliczenie roczne):

PlanCena/mies.PrzestrzeńCo obejmuje
Free$0800 min/userTranskrypcja, podstawowe podsumowania AI
Pro$108 000 min/userPełne podsumowania AI, 20 AI credits
Business$19bez limituNagrania wideo, analityka rozmów, 30 AI credits
Enterprise$39bez limituSSO, SCIM, HIPAA compliance

Fireflies obsługuje 100+ języków, jest zgodny z GDPR i posiada certyfikat SOC 2 Type II. Darmowy plan z 800 minutami daje 10–13 typowych spotkań godzinnych — wystarczy na solidny miesiąc testowania.

Tactiq — dyskretna opcja bez widocznego bota

Tactiq działa jako rozszerzenie Chrome, nie pojawia się jako dodatkowy uczestnik w spotkaniu. Dla spotkań z zewnętrznymi klientami, gdzie bot-notatnik mógłby być niekomfortowy, to praktyczna zaleta — uczestnicy nie widzą żadnego dodatkowego uczestnika w liście. Plan darmowy: 10 transkrypcji miesięcznie. Wersje płatne od ok. $10/mies. Obsługuje polski.

Fathom — nielimitowane nagrania gratis

Fathom w planie darmowym daje nielimitowane nagrania i 5 zaawansowanych podsumowań AI miesięcznie. Obsługuje Google Meet, Teams i Zoom, wspiera język polski. Dla firmy z kilkoma kluczowymi spotkaniami klienta miesięcznie darmowy plan może być wystarczający przez długi czas — Fathom ma też jedną z czytelniejszych prezentacji wyników, z wyraźnym podziałem na streszczenie, decyzje i zadania.

ChatGPT Desktop — darmowa transkrypcja bez bota

Warta wzmianki opcja dla użytkowników komputerów Mac i Windows: aplikacja ChatGPT Desktop może transkrybować dźwięk systemowy — czyli audio z całego spotkania, bez żadnego bota w pokoju. W trybie Advanced Voice Mode lub przez funkcję nagrywania ekranu + plik audio możesz wkleić nagranie i poprosić o podsumowanie. Rozwiązanie wymaga minimalnej konfiguracji i jest darmowe w planie podstawowym ChatGPT. Ograniczenie: wymaga ręcznego kroku (eksport pliku, wklejenie do czatu), więc nie zastąpi w pełni zautomatyzowanych bot-notatników.

Kilka słów o RODO przy zewnętrznych narzędziach

Transkrypcje spotkań zawierają dane osobowe uczestników: imiona, głos, omawiane tematy, a w spotkaniach sprzedażowych lub HR — często dane wrażliwe. Przy korzystaniu z zewnętrznych serwisów SaaS warto sprawdzić dwie rzeczy: czy dostawca posiada certyfikat GDPR i odpowiednią umowę DPA (Data Processing Agreement) — Fireflies ma, tl;dv ma — oraz gdzie fizycznie przechowywane są dane (serwery EU lub umowa SCCs z krajem trzecim).

Informowanie uczestników spotkania o działającym bot-notatniku to wymóg transparentności RODO, nie tylko dobra praktyka. W praktyce większość firm robi to jednym zdaniem na początku spotkania: „Nagrywam nasze spotkanie i używam AI do transkrypcji, czy to OK dla wszystkich?“. Przy spotkaniach rekrutacyjnych lub HR ten krok jest szczególnie ważny.

Własny pipeline z OpenAI Whisper — dla firm z n8n

Jeśli firma korzysta już z n8n lub Make do automatyzacji i zależy Ci na tym, żeby nagrania spotkań nie trafiały na zewnętrzne serwery — własne wdrożenie z Whisper API może być lepszą opcją niż SaaS.

OpenAI Whisper API kosztuje $0,006 za minutę (model whisper-1) lub $0,003/min (gpt-4o-mini-transcribe). Dla porównania: Google Cloud Speech-to-Text i AWS Transcribe to ok. $0,024/min — Whisper jest ~4-krotnie tańszy. Typowy koszt dla firmy z 5 godzinami nagrań tygodniowo: $12–18/mies. za samo API.

Whisper jest dostępny jako model open-source (GitHub: openai/whisper) — można go uruchomić lokalnie na własnym serwerze. W tej konfiguracji nagrania nie wychodzą na zewnątrz, co upraszcza ocenę RODO przy transkrypcji spotkań zawierających dane handlowe lub dane osobowe klientów.

Typowy pipeline z n8n:

Spotkanie kończy się → Plik audio/video ląduje na Google Drive / SharePoint
   → n8n wykrywa nowy plik
   → Audio wysyłane do Whisper API
   → Transkrypt trafia do Claude / GPT-4o: "Wyciągnij podsumowanie, decyzje, action items"
   → Wynik zapisywany automatycznie w Notion, Slack lub CRM

Jednorazowe wdrożenie takiego pipeline’u zajmuje zwykle 2–4 dni robocze. Potem system działa bez ingerencji — każde nagrane spotkanie generuje strukturalną notatkę bez żadnego ręcznego kroku.

Ostrzeżenie: Whisper dla języka polskiego osiąga wyższy wskaźnik błędów w transkrypcji niż dla angielskiego. Dla standardowych spotkań biurowych z wyraźną mową wyniki są akceptowalne. Przy słabej jakości dźwięku lub silnym akcencie regionalnym warto przetestować na kilku nagraniach przed wdrożeniem produkcyjnym.

Jeśli interesuje Cię szerszy obraz podobnych automatyzacji procesowych — pisaliśmy o tym, jak agenci AI przejmują powtarzalne zadania w MŚP.

Jak prowadzić spotkanie, żeby AI nagrała je skutecznie

Nawet najlepsze narzędzie do transkrypcji da słabe wyniki, jeśli spotkanie jest chaotyczne. Kilka nawyków, które znacząco poprawiają jakość automatycznych notatek:

Przedstawiaj się z imienia na początku. Większość narzędzi próbuje identyfikować głosy mówców (speaker diarization), ale robią to skuteczniej, gdy ktoś powie „Marta, tu Andrzej”. Fireflies i tl;dv próbują przypisywać kwestie do uczestników — dane z kalendarza spotkania pomagają im to zrobić.

Podsumowuj decyzje głośno przed końcem. Zamiast zakończyć spotkanie i liczyć, że AI sama wywnioskuje, co ustalono — wystarczy jedno zdanie: „Czyli ustalamy, że Marek odpowiada za wdrożenie do 15 czerwca, a Ania przygotuje brief. Zgoda?“. Ta sekunda świadomie powiedziana podsumowania to złoto dla modeli AI generujących action items.

Unikaj równoczesnego mówienia. Transkrypcja audio z nakładającymi się głosami jest trudna dla każdego modelu — i najczęściej gubi właśnie te fragmenty, które są kluczowe. Prosta zasada: jeden mówi, reszta słucha.

Jakość audio ma znaczenie. Słuchawki z mikrofonem dają znacznie lepszą transkrypcję niż głośnik laptopa w otwartym open space. Jeśli ktoś rozmawia z kawiarni lub hałaśliwego miejsca — poproś o wyciszenie tła albo przygotuj się na gorszy fragment transkryptu z jego kwestiami.

Sprawdź transkrypt raz po spotkaniu. AI poprawi 80–90% notatek automatycznie, ale warto poświęcić 2–3 minuty na weryfikację action items — czy AI poprawnie przypisała zadania do właściwych osób i dat. Jeden szybki przegląd zamiast 20-minutowego pisania notatki z pamięci to nadal wyraźna oszczędność czasu.

Jak wybrać rozwiązanie dla swojej firmy

Kilka pytań, które skracają decyzję:

Używasz Microsoft 365 i masz spotkania zaplanowane z kalendarza? Sprawdź Copilot Facilitator — ale policz koszty: 18 EUR/user/mies. × liczba użytkowników kontra Fireflies.ai Pro za $10/mies. dla całego konta. Jeśli kluczowe są integracje z CRM i analityka rozmów sprzedażowych, Copilot ma realną przewagę. Jeśli chcesz głównie notatek po spotkaniach wewnętrznych — tl;dv Free wystarczy na długo.

Używasz Google Workspace i spotkania prowadzisz po polsku? Wbudowany Google Meet odpada dla polskich spotkań (brak obsługi języka w transkrypcji i Gemini). Zainstaluj Fireflies.ai lub tl;dv — działają na Meet bez żadnych zmian w infrastrukturze, wyniki mogą trafić na Google Drive lub do Slacka automatycznie.

Masz zespół sprzedażowy i zależy Ci na integracji z CRM? Fireflies.ai Pro ($10/mies. rocznie) daje pełne integracje z HubSpot, Pipedrive i Salesforce. Notatka ze spotkania z klientem trafia do CRM bez jednego ręcznego kroku — to realny zysk dla firmy robiącej kilka rozmów kwalifikacyjnych tygodniowo.

Zależy Ci na prywatności danych i pełnej kontroli? Lokalny Whisper na własnym serwerze + n8n. Jednorazowe wdrożenie 2–4 dni, potem $12–18/mies. za API dla typowej firmy 10-osobowej. Dobre dla firm przetwarzających poufne dane w spotkaniach (prawo, medycyna, finanse).

Chcesz zacząć bez żadnych kosztów? tl;dv Free (nielimitowane spotkania) lub Fireflies.ai Free (800 min, ~10–13 spotkań). Miesiąc testowania wystarczy, żeby ocenić, czy notatki AI faktycznie wchodzą w życie firmy — czy tylko leżą w zakładkach przeglądarki.

Podsumowanie

Automatyczne notatki ze spotkań to jedna z niewielu automatyzacji, którą firma odczuwa od pierwszego dnia wdrożenia. Bez tygodni szkoleń, bez żmudnej konfiguracji, bez zmiany nawyków — poza tym, żeby na początku spotkania zaakceptować bota-notatnika.

Najczęstszy błąd: zakładanie, że Google Meet „ma już AI notatki” tylko dlatego, że płacisz za Business Standard. Dla polskich spotkań trzeba sięgnąć po zewnętrzne narzędzia lub Teams Copilot — wbudowany Gemini w Meet tu nie zadziała.

Wybór narzędzia nie musi być ostateczny. Wiele firm zaczyna od darmowego planu tl;dv, po kilku miesiącach przechodzi na Fireflies.ai Pro z integracją CRM, a z czasem buduje własny pipeline z Whisper API pod kątem większych wolumenów nagrań i pełnej kontroli danych. To naturalna ścieżka dojrzewania — nie ma powodu, żeby od razu kupować najdroższe rozwiązanie.

Wskazówka: Zacznij od tl;dv lub Fireflies.ai Free. To koszt zerowy i kilkanaście minut konfiguracji. Jeśli po miesiącu aktywnie używasz narzędzia i chcesz rozbudować o integracje z CRM, automatyczne raporty lub własny pipeline z pełną kontrolą danych — chętnie pokażemy, jak to wygląda od środka.

§ Zaczynamy

Napisz. Odpiszemy.

Umów 30 minut →