Categoría: Computación aplicada

Urtubey se cortó con la navaja de Ockham

Urtubey se cortó con la navaja de Ockham

Loading BIOS…

A raíz de la noticia (Clarín y Página 12) que se conoció, acerca de la pieza de software que permitiría predecir el embarazo adolescente, se sucedieron una serie de intercambios en diferentes ámbitos vinculados con ciencias de la computación, ciencias sociales y ciencias de la salud. Esto implicó que, necesariamente las respuestas, tuvieran un carácter interdisciplinario y apuntaran a los múltiples errores en que el proyecto incurre.

En un afán por esa modernidad conservadora, tan de moda hoy en día, el gobernador de Salta, anunció con bombos y platillos la implementación de un software, desarrollado por una empresa privada, que permitiría predecir, con un alto grado de certeza, cuando una adolescente de bajos recursos, podía quedar embarazada. Escrito por Phillip K. Dick, es una genialidad literaria, dicho por el gobernador Urutubey es una Zoncera con mayúsculas.

Los problemas que tiene todo el proyecto abarcan todas las áreas y eso fue percibido por la comunidad científica, que en sus distintas disciplinas, cada una en su especificidad, fueron encontraron los errores pertinentes. Al menos eso fue lo que pudimos percibir en los ámbitos que participamos. Una suerte de reacción social, que sin una centralidad dada, coordinó sus respuestas, más allá del impacto que pueda tener esta advertencia acerca del uso de la tecnología en la salud.

Las fuentes en las que basamos esta crónica, son diversas y más propias de metodologías cualitativas que de otro tipo de abordajes. Fueron conversaciones cara a cara, mensajes de whatsapp, correos electrónico, posts en redes sociales, noticias en medios tradicionales como periódicos, radio o televisión y hasta, lo más importante, las charlas de pasillo de universidades, institutos, etc. Entre quienes con con nombre y apellido figuraron en estas discusiones, se encuentran el grupo Antropocaos de Filosofía y Letras de la UBA, el Laboratorio de Inteligencia Artificial Aplicada de Exactas de la UBA, la revista El Gato y La Caja y el Instituto de Salud Colectiva de la UNLa.

La idea entonces es realizar una compilación sucinta de los diferentes problemas que se le detectaron al programa presentado por el gobernador salteño. Cuando se realiza una crítica es importante poner entre paréntesis la tendencia a demonizar sujetos y objetos. No se trata de cuestiones muy generales que no tiene sentido responder, como por ejemplo si la tecnología es buena o mala, o sólo alcanza con las buenas intenciones. Lo que se necesita es una mirada epistemológica, que sin dejar de lado los supuestos ideológicos (imposibles de soslayar), permita discernir cuándo un conocimiento es adecuado y cuándo adolece de problemas formales insalvables.

En el principio fue la filosofía

Como sugerimos en el título, Urtubey se cortó con la navaja de Ockham. Ockham fue un filósofo franciscano del siglo XIV, quien, entre otras cosas, postuló el principio de la elegancia lógica. Esta reivindicación de la parsimonia sostiene que frente a dos soluciones, la mejor es siempre la más simple. En latín, como gustaban escribir en esa época, la frase es: “Pluralitas non est ponenda sine necessitate”, que quiere decir que la pluralidad no se debe proponer si no es necesaria.

El origen político del programa presentado por el gobernador, tiene que ver con que la provincia de Salta, desde hace años, incumple la Ley Nacional de Salud Sexual y Reproductiva. Frente al problema del embarazo adolescente, el ejecutivo salteño optó, entre otras cosas, por la contratación de una consultora de software para el desarrollo de una aplicación que permitiera detectarlo. Y aquí se incurre en el primer error. Pongamos un ejemplo de otro ámbito que ayude a ilustrar el punto.

Se podría desarrollar una pieza de inteligencia artificial que predijera qué conductores son los más propensos a tener accidentes de automóvil. De este modo se podría hacer prevención sobre esas personas o “vigilarlos” para que no cumplan con ese destino prefijado. Cualquier similitud con el determinismo extremo, no es pura coincidencia. Ahora bien, es mucho más efectivo (y barato) implementar una Ley que obligue a usar el cinturón de seguridad, a realizar la verificación técnica de los automóviles (con el fin de evitar posibles desperfectos que pudieran ocasionar un accidente) y a tener el sistema de calles, semáforos, velocidades máximas en óptimas condiciones. El efecto, al ser una Ley Nacional, es mucho más abarcador y los costos, por supuesto, son muchísimo menores, todo lo cual redunda en una mayor efectividad.

Con el problema del embarazo adolescente sucede exactamente lo mismo. Si se cumplieran los preceptos de la Ley y se diera educación sexual integral en las escuelas, se repartieran desde los organismos de salud diferentes tipos de métodos anticonceptivos, se empoderara a las chicas a que puedan decir que no, cuando no quieren o no se sienten seguras, los riesgos del embarazo adolescente se reducirían notablemente. Pero claro la tecnología es el nuevo fetichismo de la era de la información y el esnobismo estatal paga un precio altísimo por algo que se puede resolver con mayor efectividad y encima gastando muchísimos menos recursos.

En cualquier caso, no se trata aquí, de que el gobernador sea un experto en tecnología para que pueda darse cuenta que, a la hora de aplicar una política pública o implementar un programa, deban tomarse en cuenta la eficiencia y los costos de cada solución propuesta. Hay que extremar las precauciones, al fin y al cabo la navaja de Ockham siempre es muy filosa y ya se observa sangre en las manos del gobernador.

Si hablamos de salud, tenemos que hablar de ciencias sociales

Cada vez queda más claro que los procesos de salud-enfermedad-atención son fenómenos complejos, con múltiples aristas que van desde la molécula hasta el símbolo. No hay enfermedad sin contexto y eso implica necesariamente un entorno social, con todas las particularidades del caso. Si el problema es la sexualidad, con más razón no se puede prescindir de lo que tengan que aportar las ciencias sociales, ya que más claramente que en otros casos, estamos hablando de pautas y conductas culturales.

Pero antes de comentar los problemas que tiene esta pieza de software desde un punto de vista sociológico, hay algo que aparece en la nota y que no podemos pasar por alto. Y tiene que ver con la ley de Habeas Data. Mal que nos pese, el Derecho es una ciencia social, así reza al menos el cartel en la entrada de la facultad y salvo que invoquemos a Dios (hipótesis que debe dejarse de lado cuando se realiza una investigación científica), el estudio de las leyes, es claramente un asunto mundano. Pues bien, en la nota que le hacen al gobernador, claramente dice al comienzo que el software propuesto no viola la ley de Habeas Data, que protege los datos sensibles de los individuos. Pero la propia naturaleza del sistema propuesto, permite identificar con nombre y apellido a las posibles embarazadas. Una contradicción en los términos, al menos en el sentido lógico. Es probable que un abogado hábil pueda encontrarle la vuelta y traficar la legalidad del acto. Sin embargo el estado no sólo debería cumplir la ley a reglamento sino fundamentalmente, interpretar su espíritu en el sentido más amplio del término.

Por otra parte la gobernación de Salta contrató a una empresa privada para que desarrolle el producto. Aquí también observamos una cuestión de derecho que al menos puede señalarse. Y es que se supone que las universidades tienen prioridad por sobre las empresas privadas a la hora de establecer contratos de consultoría. Las capacidades técnicas de nuestras universidades están más allá de toda duda; de hecho la mayor parte de los consultores privados son graduados de universidades nacionales. Incluso podemos sospechar que, de haber contratado a alguna casa de estudio, le hubieran advertido del gasto inútil al que se enfrentaba. La pregunta entonces es, ¿por qué se contrata a un privado, cuando el mismo trabajo lo puede hacer una universidad estatal?

Metiéndonos de lleno en el problema, una de las primeras cosas que surgen, es la del recorte que se realizó. La hipótesis que se desprende, tanto de la nota como de la información que circula sobre cómo se desarrolló el software, es falaz e incontrastable por definición. Se asume que sólo las chicas pobres se embarazan, como si el embarazo adolescente fuera sólo un problema de los sectores de bajos recursos. Y el universo de estudio son esas mismas adolescentes. Esto recuerda aquellos trabajos de sociobiología que intentaban probar que aquellos individuos con un cromosoma Y de más, XYY, eran violentos y las pruebas se hacían… ¡en la cárcel!.

Al problema, ya de por sí estigmatizante, de la pobreza se agrega el estigma del embarazo adolescente. Cada vez más claro que el camino del infierno está sembrado de buenas intenciones. Y esto sin contar, claro está, con la opinión de las propias embarazadas (o futuras según el gobernador). ¿La decisión sobre el propio cuerpo? bien gracias. El paternalismo del estado como norma de gobierno; todo teñido, salta a la vista, de un profundo desprecio por las mujeres.

Tal vez, ya que la estadística es la ciencia del estado, nuestros gobernantes podrían tomar cursos sobre la materia en forma obligatoria. Si lo hicieran podrían distinguir los errores de tipo I y de tipo II, es decir los falsos positivos y los falsos negativos. Probablemente también entendieran qué significa un muestreo al azar y otras cuestiones vinculadas con las inferencias poblacionales.

Si algo enseñan las ciencias sociales, es que la opinión de la gente importa. Tanto las metodologías cuantitativas como las cualitativas como las no ortodoxas (redes, modelos basados en agentes, fractales, machine learning, etc.), todas coinciden en tomar en cuenta tanto las prácticas como las representaciones. Los marcos teóricos muestran cómo, a menor cantidad de recursos, menor es la posibilidad de planificar; como a menor cantidad de recursos, menor es la posibilidad de experimentar nuevas conductas (equipo que gana – o empata – no se toca). La clave, entonces, pasa por los recursos y no por algún tipo de artificio que resuelva el problema en forma inmediata.

Robocop o cuidado con Urtubey

Aunque lo expuesto es más que suficiente para derrumbar la propuesta del gobernador, el problema es aún mayor, debido a que el propio programa de inteligencia artificial, adolece de inconvenientes insalvables. Expertos en el área (del Laboratorio de Inteligencia Artificial Aplicada de Excatas de la UBA) descubrieron los problemas metodológicos que el software posee y que aquí resumimos.

El primer inconveniente que aparece, es que la encuesta original se realizó sobre adolescentes que estaban embarazadas al momento de la recolección de datos. Por lo tanto, en todo caso, el sistema podría servir para ver quien está embarazada y no para ver quien va a quedar embarazada. Una pequeña diferencia que tira abajo todo el edificio conceptual.

El segundo inconveniente es que el conjunto de datos que se utilizó para entrenar al algoritmo, es el mismo que se usó para hacer las predicciones. En general, cuando se implementan este tipo de sistemas, hay una diferencia entre el set que se usa para el entrenamiento y el que se usa para la prueba. De otro modo (y es lo que sucede aquí), los resultados quedan sobredimensionados. Como dijo un compañero de antropocaos, el desarrollo parece haber sido hecho por gente que sabe de software, pero que no tiene idea de análisis de datos.

El tercer inconveniente tiene que ver con la confiabilidad de los datos. En el área de sistemas (pero se aplica a cualquier disciplina) hay un viejo dicho: “basura entra, basura sale”. Y aquí el tema es que se pretende con una encuesta, ilustrar sobre un aspecto muy conflictivo como es el embarazo adolescente. Desde el momento en que la interrupción del embarazo es algo, aún, ilegal, es muy difícil obtener datos confiables. Esto hace que haya sectores sobrerrepresentados y otros subrepresentados. Por lo tanto, antes de desarrollar cualquier análisis, sea clásico o de inteligencia artificial, es fundamental conocer cuán confiables son esos datos, qué grado de consistencia interna tiene, si hay valores outliers, etc. Y eso no se resuelve pura y exclusivamente con un “ingenio analítico” (como denominaba Babbage a la computadora que inventó en el siglo XIX).

No es el robot, somos nosotros

Las conclusiones del análisis, que aquí recopilamos, señalan que no puede tomarse un problema como el planteado, así nomás, a la ligera. No hay tecnología que nos salve si las condiciones iniciales no son las adecuadas. Si no hay un verdadero control epistemológico sobre el problema que se quiere solucionar. Y el tema es más grave si se trata de una política pública. No hay que inventar la rueda, si ya existe; si encontramos soluciones mucho más efectivas y menos costosas, como la implementación de la Ley de Salud Sexual.

En estos tiempos de interdisciplina, de abordaje de problemas complejos desde múltiples aristas, es imperdonable que la solución se le haya encargado a una empresa sin experiencia en el área, sin conocimientos ni de ciencias sociales ni de ciencias de la salud. Es imperdonable que en las más altas esferas del gobierno sigan creyendo en un pensamiento mágico, ya no confiando ciegamente en brujos, sino en un mero algoritmo.

La tecnología es una herramienta sumamente poderosa, pero sin un control epistemológico y sin los conocimientos propios de las ciencias sociales y de las ciencias de la salud, se transforma en un fetiche vano de una superficialidad exasperante.

 

#AI aplicada a la lingüística de rescate: el caso del Quechua.

#AI aplicada a la lingüística de rescate: el caso del Quechua.

Un equipo de científicos de la PUCP desarrolla el proyecto más grande a nivel mundial para preservar el quechua con el uso de la inteligencia artificial. Ha creado un programa para convertir este idioma de voz a texto. Necesita la colaboración de miles de quechuahablantes ► https://goo.gl/1bi1TP

Publicado por Suplemento Domingo en Jueves, 1 de junio de 2017