Wat doet een LLM eigenlijk met jouw data?

Wat doet een LLM eigenlijk met jouw data?

Steeds meer bedrijven werken met een LLM, een groot taalmodel dat razendsnel tekst genereert. Je typt iets in en krijgt meteen antwoord. Maar wat gebeurt er achter de schermen met jouw input?

LLM’s zitten in chatbots, virtuele assistenten en schrijfhulpmiddelen. Van klantenservice tot contentcreatie: je krijgt advies of tekst. Maar hoe veilig is dat eigenlijk?

Hoe verwerkt een LLM je input?

Een LLM breekt je tekst eerst op in stukken, tokens genoemd. Elk token is ongeveer een woord of deelwoord. Het model kan maximaal 2.048 tokens tegelijk onthouden. Zo houd je conversatie samenhangend.

Elke token wordt omgezet in een vector—een hoog-dimensionaal getallenpatroon. Daarna gebruikt het model met zo’n 96 lagen en 175 miljard parameters een transformer-architectuur om te voorspellen welk woord het beste volgt.

De berekening gebeurt op krachtige GPU-clusters, vaak met Nvidia A100-kaarten. Een enkel verzoek draait meestal in 0,05 tot 0,2 seconden, afhankelijk van de drukte op de servers.

Wordt je data opgeslagen?

Vaak houdt een LLM-dienst logs bij om de service te verbeteren. Zo werkt dat meestal:

  • Logs worden maximaal 30 dagen bewaard.
  • Na 30 dagen worden ze automatisch geanonimiseerd.
  • Backups draaien elke 24 uur en worden 7 dagen bewaard.
  • Data is versleuteld met AES-256.

Bij Score Agency slaan we geen wachtwoorden of persoonlijke ID’s op. We bewaren alleen anonieme statistieken—zoals het gemiddelde aantal tokens per sessie (rond de 450 tokens) en het foutpercentage (momenteel 0,8%).

Sommige leveranciers bieden een opt-out: jouw data wordt dan direct verwijderd, zonder dat het in trainingsdata komt. Dat kan 5–10% extra rekentijd kosten, maar verhoogt je privacy.

Hoe beschermt Score Agency je privacy?

Wij zijn ISO-27001-gecertificeerd en hosten bij een EU-partner. Dat houdt in:

  • End-to-end encryptie tijdens transport en opslag.
  • Servers in Nederland of Duitsland.
  • Maximaal 3 geautoriseerde engineers met toegang tot logs.
  • Automatische anonimisering na 30 dagen.

We rouleren encryptiesleutels elke 90 dagen, voeren penetratietesten uit elke 6 maanden en monitoren dagelijks zo’n 100.000 events met een SIEM-tool. Daardoor filteren we automatisch 99,5% false-positives.

Tips om je data veilig te houden

  • Vermijd het invoeren van creditcardnummers of wachtwoorden.
  • Kies een aanbieder met ISO-27001 of SOC2-certificaat.
  • Gebruik een endpoint in je eigen cloudomgeving.
  • Lees het privacybeleid: zoek naar dataretentie en encryptie.

Plan elke 3 maanden een review van je data-flow en update je softwareversies. Zo blijf je de controle houden.

Conclusie

Een LLM zet je tekst om in tokens, rekent snel het volgende woord uit en bewaart alles maximaal 2.048 tokens in het geheugen. Jouw data? Die wordt kort bewaard, sterk versleuteld en na 30 dagen geanonimiseerd.

Onlangs hebben we bij een retailklant 20.000 conversaties gemigreerd met zero downtime. In 2 uur tijd werd alles versleuteld overgezet, zonder dat iemand iets merkte.

Wil je een LLM veilig integreren in je eigen omgeving? Neem contact op en ontdek wat wij voor je kunnen betekenen.

Veelgestelde vragen

Slaat een LLM gesprekken op?

Een LLM slaat gesprekken tijdelijk op in logs. Bij Score Agency worden die logs maximaal 30 dagen bewaard en daarna geanonimiseerd.

Hoeveel tokens verwerkt een LLM tegelijk?

Een LLM met 2.048 tokens context kan zo’n 1.500 tot 1.700 woorden per sessie onthouden.

Wordt mijn data gebruikt om het model te trainen?

Standaard niet. Alleen als je expliciet toestemming geeft gebruiken we anonieme data pas na 60 dagen voor training.

Hoe is mijn data versleuteld?

Data is end-to-end versleuteld met AES-256 tijdens transport en rust.

Waar staan de servers van Score Agency?

Servers staan in Nederland of Duitsland bij een ISO-27001-gecertificeerde cloudprovider.

Wie mag mijn data inzien?

Maximaal 3 geautoriseerde engineers binnen Score Agency met strikte rol- en rechtenstructuur.

Hoe lang bewaart Score Agency mijn data?

Logs en conversatiedata worden 30 dagen bewaard en daarna automatisch geanonimiseerd.

Is Score Agency GDPR-proof?

Ja, we voldoen volledig aan de AVG/GDPR en sluiten verwerkersovereenkomsten af met elke klant.

Hoe zie ik wat er met mijn data gebeurt?

Via ons dashboard zie je in realtime welke API-calls en hoeveel tokens er per dag zijn gebruikt.

Kost data-encryptie extra?

Nee, data-encryptie is inbegrepen bij ieder maatwerkpakket en brengt geen extra kosten met zich mee.

Contact us

Samen nadenken over de beste oplossing..

Samen met onze klanten bedenken wij unieke software oplossingen. Het begint met een idee, een richting en dan komt onze ervaring voor de rest.

Waar ligt onze kracht?
What happens next?
1

We analyseren de vraag en komen met ideeën.

2

Een meeting met alles op tafel volgt. Hands on!

3

Wij maken een vrijblijvend scherp voorstel.

Plan een meeting of call