Sabotatge algorítmic: el risc de l'enverinament de dades en els models d'IA propis

De Esteban Sardanyés el 11.6.2026

<span id="hs_cos_wrapper_name" class="hs_cos_wrapper hs_cos_wrapper_meta_field hs_cos_wrapper_type_text" style="" data-hs-cos-general-type="meta_field" data-hs-cos-type="text" >Sabotatge algorítmic: el risc de l'enverinament de dades en els models d'IA propis</span>

L'ús de la Intel·ligència Artificial en entorns empresarials creix a gran velocitat: el 92% de les entitats financeres ja la utilitzen en operacions crítiques i més del 87% de les organitzacions pateixen ciberatacs potenciats per IA.

En aquest escenari, l'enverinament de dades o sabotatge algorítmic s'ha convertit en una de les amenaces més avançades. La manipulació de les dades utilitzades pel model pot alterar-ne el comportament i provocar decisions errònies amb un impacte directe i crític en el negoci.

Què és l'enverinament de dades en models d'Intel·ligència Artificial

L'enverinament de dades és una tècnica de ciberatac que consisteix a introduir informació falsa o manipulada en les dades que una Intel·ligència Artificial utilitza per entrenar-se. A diferència d'atacs més directes, com ara el prompt injection en xatbots, el seu objectiu és alterar de manera silenciosa el comportament del model perquè prengui decisions errònies sense ser detectat.

Quan una IA aprèn a partir de dades compromeses, pot automatitzar errors, aprovar operacions fraudulentes, ignorar riscos de seguretat o generar decisions de negoci incorrectes, amb un impacte directe en l'operativa i la continuïtat de l'organització.

Com identificar i detectar el sabotatge en els teus fluxos de dades

Detectar un atac d'enverinament de dades és especialment complex perquè la Intel·ligència Artificial continua funcionant amb aparent normalitat. Tot i això, hi ha diversos indicadors que poden alertar d'una possible manipulació:

Descens sobtat en la precisió del model: una reducció inesperada en la qualitat de les prediccions o resultats pot indicar que la IA està aprenent a partir d'informació alterada.
Respostes o decisions anòmales: si el sistema comença a generar comportaments inusuals davant determinats perfils, operacions o escenaris, podria estar aplicant regles que no formaven part de la seva configuració original.
Accessos no autoritzats a bases de dades: els atacants acostumen a necessitar accedir als conjunts de dades o a l'entorn de desenvolupament abans de manipular la informació utilitzada per la IA.
Modificacions inesperades en les dades utilitzades per la IA: els canvis injustificats en registres, etiquetes o fonts d'informació s'han d'investigar per descartar una alteració maliciosa.
Patrons anòmals de càrrega o actualització de dades: increments sobtats en el volum d'informació incorporada o actualitzacions procedents de fonts no habituals poden ser un senyal de risc.

La monitorització contínua d'aquests indicadors permet identificar possibles intents de sabotatge abans que les dades compromeses afectin el rendiment i el comportament de la Intel·ligència Artificial.

Passos essencials per contenir un atac contra la teva IA

Si es confirma que les dades utilitzades pel teu model d'Intel·ligència Artificial han estat manipulades, les primeres hores són crítiques per contenir l'incident i reduir l'impacte operatiu, legal i reputacional. Aquestes són les accions clau:

Aïllar el model i aturar els processos automàtics

Desconnecta els sistemes afectats de l'entorn productiu i suspèn qualsevol flux automàtic d'actualització o ajustament del model. Així evitaràs que les dades alterades continuïn influint en el comportament del sistema o es propaguin a altres entorns connectats.

Auditar la traçabilitat de les dades

Revisa l'historial de canvis per identificar quina informació ha estat modificada, quan va passar i quins usuaris o processos hi van estar implicats. Això permet localitzar l'origen de l'incident.

Revertir a una versió verificada del sistema

Restaura el model a una versió anterior segura utilitzant còpies de seguretat i dades validades, assegurant que no continguin alteracions.

Analitzar l'abast de l'incident

Determina quines decisions, processos o àrees de negoci poden haver-se vist afectades durant el temps en què el model va estar compromès.

Notificar i documentar la bretxa

Registra l'incident de manera detallada i, si hi ha dades personals o financeres afectades, informa les autoritats competents dins del termini legal de 72 hores.

Reforçar els controls i la monitorització

Un cop continguda la situació, reforça els sistemes de control d'accés i supervisió per reduir el risc que torni a produir-se i detectar anomalies amb més rapidesa.

Recomanacions essencials per prevenir l'enverinament de dades

Per protegir els models d'Intel·ligència Artificial és fonamental aplicar un enfocament basat en Zero Trust, validant sempre cada dada abans que sigui utilitzada. Això redueix el risc que informació manipulada arribi a influir en el comportament del sistema.

A més, és clau reforçar el control d'accessos i el xifratge de la informació, juntament amb auditories periòdiques i l'ús de signatures criptogràfiques. Aquestes mesures permeten detectar alteracions no autoritzades i garantir la integritat de les dades en tot moment.

ESED, avalua la teva exposició davant dels ciberatacs

A ESED treballem amb una tarifa fixa mensual que inclou serveis proactius orientats a mantenir els sistemes protegits i operatius de manera contínua. Aquest model permet a les empreses anticipar-se als incidents de seguretat i reduir la dependència d'actuacions reactives o costos imprevistos.

A més, pots avaluar el nivell de preparació de la teva empresa davant d'un ciberatac mitjançant el nostre test de ciberseguretat. No cal disposar de coneixements tècnics avançats i consta de 36 preguntes basades en estàndards del sector, dissenyades per identificar el nivell real d'exposició i maduresa en seguretat.