Esto será extraordinariamente difícil de hacer en tiempo de ejecución, y con cualquier documento. Las pocas soluciones que han implementado esta tecnología (agente de recuerdo http://www.remem.org/ y el tablero de mandos http://nat.org/dashboard/ son probablemente las más notables y "exitosas") requerían indexadores de búsqueda específicos para cada tipo de aplicación y un análisis previo de los documentos. (Muy al estilo de cómo no se puede buscar en Spotlight mientras se está "actualizando").
Por ejemplo, si escribes la palabra "de", no necesariamente querrás ver todos tus mensajes de correo electrónico sólo porque todos ellos incluyan la palabra como parte de sus metadatos. Sin embargo, si escribiera "Art Taylor", esperaría ver el correo electrónico, el chat y otros documentos relacionados conmigo.
El problema es resumir el contenido semántico a partir del contenido estructural. Por eso DEVONthink requiere que se importen los documentos. Puede resumir los documentos y presentar los resultados más o menos en tiempo real, porque ha hecho el resumen por adelantado. Spotlight también hace algo de esto, pero no han aparecido grandes aplicaciones de aumento del conocimiento y la memoria conscientes del contexto que ofrezcan soporte universal de documentos.
Si se busca en Google "knowledge augmentation", se encontrará un gran número de artículos y documentos sobre el tema. La gente está muy interesada en esto y creo que es cuestión de tiempo que alguien ataque el problema con una solución comercial. Gordon Bell tenía un proyecto tentador llamado "MyLifeBits" http://research.microsoft.com/en-us/projects/mylifebits/ eso fue un poco exagerado, pero IBM http://www-03.ibm.com/press/us/en/pressrelease/24750.wss está investigando sobre el recuerdo asociativo. Observe las etapas de "Captura" e "Ingesta". El alcance de ambas va mucho más allá de las simples relaciones entre documentos.
Hace años, probé el enfoque de DEVONthink de "ponerlo todo ahí", y como probablemente sospechas, fue un desastre.
La mejor de las suertes.