O paradoxo da automação em radiologia

hub/textos/o-paradoxo-da-automacao-em-radiologia.md

# O paradoxo da automação em radiologia

> A IA pode melhorar a radiologia, mas também depende da preservação da expertise radiológica. Se a automação reduz o atrito cognitivo que forma e mantém bons radiologistas, ela pode enfraquecer a própria régua humana usada para validar, auditar e corrigir os modelos.

Publicado em 13 de maio de 2026

A discussão sobre inteligência artificial em radiologia costuma começar pela pergunta errada.

A pergunta habitual é: a IA vai substituir o radiologista?

A pergunta mais importante talvez seja outra: o que acontece com a qualidade do radiologista quando parte crescente da interpretação passa a ser mediada, sugerida ou filtrada por sistemas automatizados?

Essa preocupação não é apenas corporativa.

É técnica.

Modelos de IA em saúde dependem de validação contínua, auditoria, curadoria de dados, revisão de discordâncias, monitoramento prospectivo e definição de algum tipo de ground truth. Mesmo quando parecem autônomos, continuam dependendo de uma camada humana qualificada.

O paradoxo é este: quanto mais a IA assume tarefas radiológicas, mais importante fica preservar radiologistas capazes de avaliar, corrigir e auditar a própria IA.

## A ironia da automação

A literatura de fatores humanos já descreve esse problema há décadas.

Lisanne Bainbridge, em “Ironies of Automation”, mostrou que sistemas automatizados não eliminam o problema humano. Muitas vezes, apenas deslocam o humano para situações mais raras, mais críticas e mais difíceis.

O operador deixa de praticar rotineiramente habilidades que serão exigidas justamente quando a automação falhar.

Parasuraman, Sheridan e Wickens também propuseram um modelo clássico de níveis de automação mostrando que automatizar não significa apenas retirar trabalho humano. A automação muda a natureza do trabalho humano. Ela altera vigilância, decisão, coordenação, responsabilidade e interação entre pessoa e sistema.

Esse ponto importa muito para radiologia.

Se a IA assume triagem, detecção, priorização, marcação de achados e rascunho de laudo, o radiologista não desaparece necessariamente. Mas o trabalho que sobra muda.

E nem toda mudança preserva expertise.

## O que pode se perder

Radiologia não é apenas reconhecer padrões.

Radiologia é também procurar o que não foi sugerido, desconfiar do enquadramento inicial, correlacionar achado com contexto clínico, comparar exames antigos, reconhecer artefato, lidar com protocolo imperfeito, perceber exceção e comunicar incerteza.

Parte dessa competência vem do atrito cognitivo do trabalho diário.

O caso normal.

O caso ruim.

O exame tecnicamente limitado.

O achado sutil.

A apresentação atípica.

A doença rara.

O artefato que parece patologia.

A patologia que parece artefato.

Se a automação remove progressivamente esse atrito, o radiologista médio pode ficar menos treinado para reconhecer exceções. Não porque ficou menos inteligente. Mas porque praticou menos as habilidades que sustentam julgamento independente.

Esse risco é maior em ambientes de alta produtividade, pouco feedback e baixa revisão estruturada.

No contexto brasileiro, minha impressão é que parte dos egressos da residência entra cedo em rotinas de telerradiologia com pouco retorno sistemático sobre erro, discrepância, desfecho e qualidade do laudo. Se isso for verdadeiro em escala, a IA não inauguraria a fragilidade da formação. Ela apenas aceleraria um processo que já existe.

Essa é uma afirmação que precisa ser tratada com cuidado. Não é uma acusação individual. É uma hipótese operacional: sistemas com muito volume e pouco feedback tendem a treinar mal.

## A IA também precisa de radiologistas bons

O problema é que a IA também aprende com humanos.

Mesmo modelos modernos, com pré-treinamento auto-supervisionado, arquiteturas fundacionais e grandes volumes de dados, precisam em algum momento de validação clínica, comparação com especialistas, avaliação prospectiva, curadoria de casos e revisão de falhas.

Kelly et al. destacaram que o impacto clínico da IA depende de generalização, segurança, validação externa e tradução para a prática real. Esse não é um detalhe posterior ao modelo. É parte do problema.

A IA médica não tem acesso direto à verdade.

Ela acessa bancos de dados, laudos, rótulos, anotações, desfechos, consensos e decisões humanas registradas.

Se esses insumos forem ruidosos, enviesados ou empobrecidos, o modelo pode performar bem em métricas aparentes e ainda assim degradar clinicamente.

Oakden-Rayner mostrou problemas relevantes de qualidade de labels em grandes bases públicas de imagem médica. Ghassemi, Oakden-Rayner e Beam também chamaram atenção para a fragilidade de certas promessas de explicabilidade em saúde. O ponto comum é simples: datasets grandes não são necessariamente datasets verdadeiros, e explicações visuais não resolvem sozinhas o problema de confiança.

Além disso, redes neurais podem aprender atalhos estatísticos.

Geirhos et al. descrevem o fenômeno de shortcut learning: modelos podem alcançar excelente desempenho em benchmarks explorando pistas que funcionam no dataset, mas não representam o fenômeno clínico que gostaríamos que aprendessem.

Em radiologia, esses atalhos podem estar em:

- protocolo;

- aparelho;

- compressão da imagem;

- marcador textual;

- instituição de origem;

- prevalência local;

- padrão de aquisição;

- presença de tubos, drenos ou dispositivos;

100

- viés populacional.

101

102

O modelo parece aprender doença.

103

104

Mas às vezes aprende o contexto em que a doença costuma aparecer.

105

106

## O contraponto importa

107

108

Há um argumento contrário forte: a IA pode melhorar a qualidade média da radiologia.

109

110

Esse contraponto é correto.

111

112

IA pode reduzir fadiga, aumentar consistência, detectar achados sutis, priorizar urgências, padronizar laudos e apoiar profissionais menos experientes.

113

114

CheXNet ajudou a consolidar essa visão em radiografia de tórax, ao demonstrar desempenho elevado em tarefa específica de detecção de pneumonia. Estudos em mamografia, como o MASAI, também mostram que estratégias com suporte de IA podem manter ou melhorar detecção e reduzir carga de leitura em programas de rastreamento.

115

116

Portanto, o problema não é a IA em si.

117

118

O problema é a ecologia operacional em que ela entra.

119

120

Se a IA funcionar como segunda leitura, ferramenta educacional, geradora de feedback, mecanismo de auditoria e amplificadora de revisão, ela pode melhorar a prática.

121

122

Se funcionar apenas como mecanismo de compressão de custo, aumento de volume e redução de formação, ela pode empobrecer o radiologista e, paradoxalmente, enfraquecer a própria base humana que sustenta a IA.

123

124

Esse risco não nasce da técnica isolada. Nasce do modo como a automação é incorporada ao trabalho: como ferramenta de formação, auditoria e suporte, ela pode elevar a prática; como mecanismo de compressão de custo, aumento de volume e redução de autonomia, pode intensificar o trabalho e degradar a expertise que deveria preservar.

125

126

## Uma analogia incômoda

127

128

O risco de deskilling não é apenas especulação teórica.

129

130

Em 2025, um estudo multicêntrico publicado no Lancet Gastroenterology & Hepatology observou redução na taxa de detecção de adenomas em colonoscopias sem IA após exposição rotineira a colonoscopia assistida por IA. A analogia não deve ser usada como prova direta para radiologia, porque endoscopia e radiologia têm fluxos, gestos e métricas diferentes.

131

132

Mas ela é útil como alerta.

133

134

Sistemas de apoio podem melhorar desempenho quando estão presentes e, ao mesmo tempo, alterar a competência humana quando deixam de estar.

135

136

Essa possibilidade precisa ser medida, não presumida.

137

138

## O radiologista como régua

139

140

O ponto epistemológico central é que a IA radiológica precisa de uma régua humana.

141

142

Não uma régua perfeita.

143

144

Uma régua auditável, treinada, calibrada e continuamente exposta a casos difíceis.

145

146

Se essa régua piora, a avaliação da IA também piora.

147

148

O risco mais perigoso não é a IA errar de forma óbvia.

149

150

É a IA errar de forma plausível.

151

152

O sistema sugere.

153

154

O radiologista aceita.

155

156

O erro entra no laudo.

157

158

O laudo vira dado.

159

160

O dado volta para treinamento, validação ou benchmark.

161

162

Com o tempo, o ciclo pode produzir uma forma de drift silencioso: primeiro o humano confia mais no sistema; depois pratica menos; em seguida valida pior; por fim, a IA passa a ser auditada por uma régua humana já degradada.

163

164

## O desenho operacional muda tudo

165

166

Nada disso implica que a IA deva ser evitada.

167

168

Implica que sua implementação precisa ser desenhada para preservar expertise.

169

170

Algumas decisões práticas importam:

171

172

- manter revisão humana independente em amostras relevantes;

173

- medir discordâncias entre radiologista e IA, não apenas concordância;

174

- criar rotinas de auditoria de casos negativos, não só de casos sinalizados;

175

- proteger tempo para revisão de erro e feedback;

176

- usar IA como segunda leitura em contextos de formação, não apenas como atalho;

177

- manter bancos de casos difíceis e atípicos para treinamento contínuo;

178

- monitorar performance humana ao longo do tempo, não apenas performance do modelo;

179

- auditar drift por protocolo, aparelho, instituição, população e mudança temporal;

180

- separar ambientes de produção, ensino, validação e pesquisa.

181

182

A pergunta deixa de ser “usar ou não usar IA”.

183

184

A pergunta passa a ser: que tipo de radiologista esse sistema produz depois de cinco anos de uso?

185

186

## Conclusão

187

188

A radiologia talvez caminhe para uma distribuição mais desigual.

189

190

Muitos profissionais atuarão mais próximos da supervisão de fluxo, triagem e validação cotidiana. Um grupo menor precisará ser capaz de auditar modelos, revisar casos difíceis, construir datasets, interpretar falhas e detectar drift.

191

192

Nesse cenário, o radiologista de alto nível não desaparece.

193

194

Ele se torna mais importante.

195

196

A IA pode reduzir o valor de parte da leitura média, mas aumentar o valor da supervisão excepcional.

197

198

Essa é a conclusão incômoda: a IA pode errar e o radiologista nem saber.

199

200

Não porque a IA seja inútil.

201

202

Mas porque a automação, quando mal desenhada, pode degradar justamente a expertise humana necessária para perceber quando ela falha.

203

204

O problema não é escolher entre humano e máquina.

205

206

O problema é construir sistemas em que a máquina aumenta a capacidade humana sem destruir a régua que a mantém confiável.

207

208

## Fontes e premissas

209

210

- Bainbridge, L. “Ironies of Automation”. Automatica, 1983. https://ckrybus.com/static/papers/Bainbridge_1983_Automatica.pdf

211

- Parasuraman, R.; Sheridan, T. B.; Wickens, C. D. “A model for types and levels of human interaction with automation”. IEEE Transactions on Systems, Man, and Cybernetics, 2000. https://doi.org/10.1109/3468.844354

212

- Kelly, C. J. et al. “Key challenges for delivering clinical impact with artificial intelligence”. BMC Medicine, 2019. https://doi.org/10.1186/s12916-019-1426-2

213

- Geirhos, R. et al. “Shortcut learning in deep neural networks”. Nature Machine Intelligence, 2020. https://doi.org/10.1038/s42256-020-00257-z

214

- Ghassemi, M.; Oakden-Rayner, L.; Beam, A. L. “The false hope of current approaches to explainable artificial intelligence in health care”. The Lancet Digital Health, 2021. https://doi.org/10.1016/S2589-7500(21)00208-9

215

- Oakden-Rayner, L. “Exploring large-scale public medical image datasets”. Academic Radiology, 2020. https://doi.org/10.1016/j.acra.2019.10.006

216

- Rajpurkar, P. et al. “CheXNet: Radiologist-Level Pneumonia Detection on Chest X-Rays with Deep Learning”. arXiv, 2017. https://arxiv.org/abs/1711.05225

217

- Recht, M. P.; Bryan, R. N. “Artificial Intelligence: Threat or Boon to Radiologists?”. Journal of the American College of Radiology, 2017. https://doi.org/10.1016/j.jacr.2017.07.007

218

- Lång, K. et al. “Artificial intelligence-supported screen reading versus standard double reading in the Mammography Screening with Artificial Intelligence trial”. The Lancet Oncology, 2023. https://doi.org/10.1016/S1470-2045(23)00298-X

219

- Budzyń, K. et al. “Endoscopist deskilling risk after exposure to artificial intelligence in colonoscopy”. The Lancet Gastroenterology & Hepatology, 2025. https://doi.org/10.1016/S2468-1253(25)00133-5