
Spärck Jones, Karen
(1935 - 2007)
Karen Spärck Jones (1935-2007) fue una historiadora y filósofa que investigó sobre el procesamiento de lenguaje natural y la recuperación de la información.
En 1956, se graduó en historia y filosofía en el Girton College de la Universidad de Cambridge.
Tras trabajar un breve tiempo como maestra, comenzó su trayectoria investigadora a finales de la década de 1950, desarrollando un tesauro para la Unidad de Investigación en Lenguaje de su universidad.
A continuación, desarrolló su investigación en el Laboratorio de Computación de la Universidad de Cambridge en dos campos diferentes: el procesamiento de lenguaje natural y la recuperación de la información. El primero trata de cómo los ordenadores procesan y comprenden el lenguaje humano, mientras que el segundo consiste en encontrar información en bases de datos o redes que satisfaga las necesidades del usuario. Este campo es ampliamente utilizado en motores de búsqueda y sistemas de recomendación hoy en día.
En 1964 realizó un doctorado en lingüística computacional en la misma universidad. Su tesis titulada “Sinonimia y clasificación semántica” es pionera en el campo del procesamiento del lenguaje natural. En ella utilizó conceptos simbólicos y rigurosos en el lenguaje hablado para ser utilizados en el análisis computacional del lenguaje. Realizó también un pequeño experimento computacional, y anticipó cómo la computación podría ayudar al campo de la teoría lingüística.
En 1972 publicó “Una interpretación estadística de la particularidad de los términos y su aplicación en la recuperación”, donde se combinaban técnicas estadísticas con técnicas lingüísticas. Como resultado, propuso 2 medidas estadísticas o métricas que fueron las primeras en conseguir un buen rendimiento.
La primera métrica, denominada la “Frecuencia inversa del término”, mide la importancia de una palabra en un documento dependiendo del número de apariciones. La segunda, denominada “Frecuencia inversa del documento”, permite ordenar un conjunto de documentos según la importancia de una palabra determinada.
Hoy en día estas medidas son ampliamente utilizadas en la recuperación de la información, y su uso se intensificó notablemente tras la llegada de Internet en la década de 1990.
En 1974 empezó a trabajar de manera habitual en el Laboratorio de Informática de su misma universidad hasta su jubilación en 2002.
En 1976 desarrolló, junto con Stephen Roberson, un modelo probabilístico de la ponderación de la importancia de los términos. En este trabajo se combinaron sus medidas con otras teorías matemáticas y se pusieron en práctica tras probarlas con varios ejemplos reales.
Durante el resto de su vida, perfeccionó estas técnicas y continuó publicando artículos relacionados con el campo de la recuperación de la información. También realizó investigaciones sobre sistemas de reconocimiento de voz.
Recibió numerosas distinciones por sus investigaciones:
En 1988, el premio Gerard Salton en 1988 (otorgado por la ACM SIGIR, Special Interest Group on Information Retrieval).
En 1994 presidió la ACL, Asociación de Lingüística Computacional.
En 2007, el premio Allen Newel (por parte de ACM Association for the Advancement of Artificial Intelligence) y el premio Women’s Group Athena Award de ACM y la medalla Lovelace por parte de la sociedad británica de computación.
Fue miembro de la Academia Británica y de la Academia Nacional de Ingeniería de Estados Unidos.
A partir del año 2008, la Sociedad Británica de Computación comenzó a otorgar el “Premio Karen Spärck Jones”.