2
# O paradoxo da automação em radiologia
3
4
> A IA pode melhorar a radiologia, mas também depende da preservação da expertise radiológica. Se a automação reduz o atrito cognitivo que forma e mantém bons radiologistas, ela pode enfraquecer a própria régua humana usada para validar, auditar e corrigir os modelos.
5
7
8
A discussão sobre inteligência artificial em radiologia costuma começar pela pergunta errada.
9
10
A pergunta habitual é: a IA vai substituir o radiologista?
11
12
A pergunta mais importante talvez seja outra: o que acontece com a qualidade do radiologista quando parte crescente da interpretação passa a ser mediada, sugerida ou filtrada por sistemas automatizados?
13
14
Essa preocupação não é apenas corporativa.
15
16
É técnica.
17
18
Modelos de IA em saúde dependem de validação contínua, auditoria, curadoria de dados, revisão de discordâncias, monitoramento prospectivo e definição de algum tipo de ground truth. Mesmo quando parecem autônomos, continuam dependendo de uma camada humana qualificada.
19
20
O paradoxo é este: quanto mais a IA assume tarefas radiológicas, mais importante fica preservar radiologistas capazes de avaliar, corrigir e auditar a própria IA.
21
22
## A ironia da automação
23
24
A literatura de fatores humanos já descreve esse problema há décadas.
25
26
Lisanne Bainbridge, em “Ironies of Automation”, mostrou que sistemas automatizados não eliminam o problema humano. Muitas vezes, apenas deslocam o humano para situações mais raras, mais críticas e mais difíceis.
27
28
O operador deixa de praticar rotineiramente habilidades que serão exigidas justamente quando a automação falhar.
29
30
Parasuraman, Sheridan e Wickens também propuseram um modelo clássico de níveis de automação mostrando que automatizar não significa apenas retirar trabalho humano. A automação muda a natureza do trabalho humano. Ela altera vigilância, decisão, coordenação, responsabilidade e interação entre pessoa e sistema.
31
32
Esse ponto importa muito para radiologia.
33
34
Se a IA assume triagem, detecção, priorização, marcação de achados e rascunho de laudo, o radiologista não desaparece necessariamente. Mas o trabalho que sobra muda.
35
36
E nem toda mudança preserva expertise.
37
38
## O que pode se perder
39
40
Radiologia não é apenas reconhecer padrões.
41
42
Radiologia é também procurar o que não foi sugerido, desconfiar do enquadramento inicial, correlacionar achado com contexto clínico, comparar exames antigos, reconhecer artefato, lidar com protocolo imperfeito, perceber exceção e comunicar incerteza.
43
44
Parte dessa competência vem do atrito cognitivo do trabalho diário.
45
46
O caso normal.
47
48
O caso ruim.
49
50
O exame tecnicamente limitado.
51
52
O achado sutil.
53
54
A apresentação atípica.
55
56
A doença rara.
57
58
O artefato que parece patologia.
59
60
A patologia que parece artefato.
61
62
Se a automação remove progressivamente esse atrito, o radiologista médio pode ficar menos treinado para reconhecer exceções. Não porque ficou menos inteligente. Mas porque praticou menos as habilidades que sustentam julgamento independente.
63
64
Esse risco é maior em ambientes de alta produtividade, pouco feedback e baixa revisão estruturada.
65
66
No contexto brasileiro, minha impressão é que parte dos egressos da residência entra cedo em rotinas de telerradiologia com pouco retorno sistemático sobre erro, discrepância, desfecho e qualidade do laudo. Se isso for verdadeiro em escala, a IA não inauguraria a fragilidade da formação. Ela apenas aceleraria um processo que já existe.
67
68
Essa é uma afirmação que precisa ser tratada com cuidado. Não é uma acusação individual. É uma hipótese operacional: sistemas com muito volume e pouco feedback tendem a treinar mal.
69
70
## A IA também precisa de radiologistas bons
71
72
O problema é que a IA também aprende com humanos.
73
74
Mesmo modelos modernos, com pré-treinamento auto-supervisionado, arquiteturas fundacionais e grandes volumes de dados, precisam em algum momento de validação clínica, comparação com especialistas, avaliação prospectiva, curadoria de casos e revisão de falhas.
75
76
Kelly et al. destacaram que o impacto clínico da IA depende de generalização, segurança, validação externa e tradução para a prática real. Esse não é um detalhe posterior ao modelo. É parte do problema.
77
78
A IA médica não tem acesso direto à verdade.
79
80
Ela acessa bancos de dados, laudos, rótulos, anotações, desfechos, consensos e decisões humanas registradas.
81
82
Se esses insumos forem ruidosos, enviesados ou empobrecidos, o modelo pode performar bem em métricas aparentes e ainda assim degradar clinicamente.
83
84
Oakden-Rayner mostrou problemas relevantes de qualidade de labels em grandes bases públicas de imagem médica. Ghassemi, Oakden-Rayner e Beam também chamaram atenção para a fragilidade de certas promessas de explicabilidade em saúde. O ponto comum é simples: datasets grandes não são necessariamente datasets verdadeiros, e explicações visuais não resolvem sozinhas o problema de confiança.
85
86
Além disso, redes neurais podem aprender atalhos estatísticos.
87
88
Geirhos et al. descrevem o fenômeno de shortcut learning: modelos podem alcançar excelente desempenho em benchmarks explorando pistas que funcionam no dataset, mas não representam o fenômeno clínico que gostaríamos que aprendessem.
89
90
Em radiologia, esses atalhos podem estar em:
91
92
- protocolo;
93
- aparelho;
94
- compressão da imagem;
95
- marcador textual;
96
- instituição de origem;
97
- prevalência local;
98
- padrão de aquisição;
99
- presença de tubos, drenos ou dispositivos;
100
- viés populacional.
101
102
O modelo parece aprender doença.
103
104
Mas às vezes aprende o contexto em que a doença costuma aparecer.
105
106
## O contraponto importa
107
108
Há um argumento contrário forte: a IA pode melhorar a qualidade média da radiologia.
109
110
Esse contraponto é correto.
111
112
IA pode reduzir fadiga, aumentar consistência, detectar achados sutis, priorizar urgências, padronizar laudos e apoiar profissionais menos experientes.
113
114
CheXNet ajudou a consolidar essa visão em radiografia de tórax, ao demonstrar desempenho elevado em tarefa específica de detecção de pneumonia. Estudos em mamografia, como o MASAI, também mostram que estratégias com suporte de IA podem manter ou melhorar detecção e reduzir carga de leitura em programas de rastreamento.
115
116
Portanto, o problema não é a IA em si.
117
118
O problema é a ecologia operacional em que ela entra.
119
120
Se a IA funcionar como segunda leitura, ferramenta educacional, geradora de feedback, mecanismo de auditoria e amplificadora de revisão, ela pode melhorar a prática.
121
122
Se funcionar apenas como mecanismo de compressão de custo, aumento de volume e redução de formação, ela pode empobrecer o radiologista e, paradoxalmente, enfraquecer a própria base humana que sustenta a IA.
123
124
Esse risco não nasce da técnica isolada. Nasce do modo como a automação é incorporada ao trabalho: como ferramenta de formação, auditoria e suporte, ela pode elevar a prática; como mecanismo de compressão de custo, aumento de volume e redução de autonomia, pode intensificar o trabalho e degradar a expertise que deveria preservar.
125
126
## Uma analogia incômoda
127
128
O risco de deskilling não é apenas especulação teórica.
129
130
Em 2025, um estudo multicêntrico publicado no Lancet Gastroenterology & Hepatology observou redução na taxa de detecção de adenomas em colonoscopias sem IA após exposição rotineira a colonoscopia assistida por IA. A analogia não deve ser usada como prova direta para radiologia, porque endoscopia e radiologia têm fluxos, gestos e métricas diferentes.
131
132
Mas ela é útil como alerta.
133
134
Sistemas de apoio podem melhorar desempenho quando estão presentes e, ao mesmo tempo, alterar a competência humana quando deixam de estar.
135
136
Essa possibilidade precisa ser medida, não presumida.
137
138
## O radiologista como régua
139
140
O ponto epistemológico central é que a IA radiológica precisa de uma régua humana.
141
142
Não uma régua perfeita.
143
144
Uma régua auditável, treinada, calibrada e continuamente exposta a casos difíceis.
145
146
Se essa régua piora, a avaliação da IA também piora.
147
148
O risco mais perigoso não é a IA errar de forma óbvia.
149
150
É a IA errar de forma plausível.
151
152
O sistema sugere.
153
154
O radiologista aceita.
155
156
O erro entra no laudo.
157
158
O laudo vira dado.
159
160
O dado volta para treinamento, validação ou benchmark.
161
162
Com o tempo, o ciclo pode produzir uma forma de drift silencioso: primeiro o humano confia mais no sistema; depois pratica menos; em seguida valida pior; por fim, a IA passa a ser auditada por uma régua humana já degradada.
163
164
## O desenho operacional muda tudo
165
166
Nada disso implica que a IA deva ser evitada.
167
168
Implica que sua implementação precisa ser desenhada para preservar expertise.
169
170
Algumas decisões práticas importam:
171
172
- manter revisão humana independente em amostras relevantes;
173
- medir discordâncias entre radiologista e IA, não apenas concordância;
174
- criar rotinas de auditoria de casos negativos, não só de casos sinalizados;
175
- proteger tempo para revisão de erro e feedback;
176
- usar IA como segunda leitura em contextos de formação, não apenas como atalho;
177
- manter bancos de casos difíceis e atípicos para treinamento contínuo;
178
- monitorar performance humana ao longo do tempo, não apenas performance do modelo;
179
- auditar drift por protocolo, aparelho, instituição, população e mudança temporal;
180
- separar ambientes de produção, ensino, validação e pesquisa.
181
182
A pergunta deixa de ser “usar ou não usar IA”.
183
184
A pergunta passa a ser: que tipo de radiologista esse sistema produz depois de cinco anos de uso?
185
186
## Conclusão
187
188
A radiologia talvez caminhe para uma distribuição mais desigual.
189
190
Muitos profissionais atuarão mais próximos da supervisão de fluxo, triagem e validação cotidiana. Um grupo menor precisará ser capaz de auditar modelos, revisar casos difíceis, construir datasets, interpretar falhas e detectar drift.
191
192
Nesse cenário, o radiologista de alto nível não desaparece.
193
194
Ele se torna mais importante.
195
196
A IA pode reduzir o valor de parte da leitura média, mas aumentar o valor da supervisão excepcional.
197
198
Essa é a conclusão incômoda: a IA pode errar e o radiologista nem saber.
199
200
Não porque a IA seja inútil.
201
202
Mas porque a automação, quando mal desenhada, pode degradar justamente a expertise humana necessária para perceber quando ela falha.
203
204
O problema não é escolher entre humano e máquina.
205
206
O problema é construir sistemas em que a máquina aumenta a capacidade humana sem destruir a régua que a mantém confiável.
207
208
## Fontes e premissas
209
210
- Bainbridge, L. “Ironies of Automation”. Automatica, 1983. https://ckrybus.com/static/papers/Bainbridge_1983_Automatica.pdf
211
- Parasuraman, R.; Sheridan, T. B.; Wickens, C. D. “A model for types and levels of human interaction with automation”. IEEE Transactions on Systems, Man, and Cybernetics, 2000. https://doi.org/10.1109/3468.844354
212
- Kelly, C. J. et al. “Key challenges for delivering clinical impact with artificial intelligence”. BMC Medicine, 2019. https://doi.org/10.1186/s12916-019-1426-2
213
- Geirhos, R. et al. “Shortcut learning in deep neural networks”. Nature Machine Intelligence, 2020. https://doi.org/10.1038/s42256-020-00257-z
214
- Ghassemi, M.; Oakden-Rayner, L.; Beam, A. L. “The false hope of current approaches to explainable artificial intelligence in health care”. The Lancet Digital Health, 2021. https://doi.org/10.1016/S2589-7500(21)00208-9
215
- Oakden-Rayner, L. “Exploring large-scale public medical image datasets”. Academic Radiology, 2020. https://doi.org/10.1016/j.acra.2019.10.006
216
- Rajpurkar, P. et al. “CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning”. arXiv, 2017. https://arxiv.org/abs/1711.05225
217
- Recht, M. P.; Bryan, R. N. “Artificial Intelligence: Threat or Boon to Radiologists?”. Journal of the American College of Radiology, 2017. https://doi.org/10.1016/j.jacr.2017.07.007
218
- Lång, K. et al. “Artificial intelligence-supported screen reading versus standard double reading in the Mammography Screening with Artificial Intelligence trial”. The Lancet Oncology, 2023. https://doi.org/10.1016/S1470-2045(23)00298-X
219
- Budzyń, K. et al. “Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy”. The Lancet Gastroenterology & Hepatology, 2025. https://doi.org/10.1016/S2468-1253(25)00133-5