Cómo resolvimos el problema de la coincidencia de vacantes y currículos sin almacenar datos innecesarios

Desarrollamos un enfoque que permite comparar vacantes y currículos, minimizando la cantidad de datos almacenados.

13 Jun 2026

---

Introducción al problema de la selección de personal sin almacenamiento de datos

Recientemente, se desató una discusión en Slack sobre cómo mejor coincidir vacantes y currículos sin crear bases de datos redundantes. Uno de los desarrolladores planteó la cuestión: ¿cómo podemos almacenar solo los datos necesarios y, al mismo tiempo, asegurar una coincidencia de calidad? Esto se convirtió en un desafío para nosotros, ya que de ello dependía la eficiencia de nuestro servicio de selección de personal.

Contexto de la tarea

El problema al que nos enfrentamos surgió como resultado de la expansión de nuestra plataforma. Reclutadores y candidatos comenzaron a notar que los resultados de búsqueda de vacantes y currículos no siempre coincidían. Entendíamos que esto afectaba nuestra reputación en el mercado. Si no podemos proporcionar resultados de calidad, corremos el riesgo de perder la confianza de nuestros usuarios, especialmente en un entorno de alta competencia.

Dificultades específicas

Uno de los ejemplos que estudiamos fue la coincidencia de currículos, donde las palabras clave no siempre coincidían entre las vacantes y los candidatos. Por ejemplo, el currículo de un candidato podría contener el término «desarrollo de software», mientras que la vacante requería «programación». Esta discrepancia afectaba los resultados de búsqueda y, como consecuencia, la satisfacción de los usuarios. Entendíamos que necesitábamos encontrar un enfoque más flexible e inteligente para el procesamiento de datos.

Primeras tentativas de solución

La primera solución que probamos fue utilizar algoritmos simples basados en palabras clave. Creamos un sistema que coincidía vacantes y currículos en función de la frecuencia de aparición de palabras. Sin embargo, esta solución resultó ineficaz. Durante las pruebas, notamos que muchos candidatos adecuados no encontraban vacantes debido a la falta de coincidencia en la terminología. Esto se convirtió en una señal para nosotros de que necesitábamos un análisis más profundo.

Enfoque técnico para la solución

Finalmente, decidimos utilizar un algoritmo de aprendizaje automático más complejo que tuviera en cuenta el contexto de las palabras y su semántica. Implementamos un modelo entrenado en un conjunto de datos que contenía diversas vacantes y currículos. Un ejemplo de código que ilustra los puntos clave de la implementación:

from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

vectorizer = TfidfVectorizer()
vacancy_matrix = vectorizer.fit_transform(vacancies)
candidate_matrix = vectorizer.transform(candidates)

similarity = cosine_similarity(vacancy_matrix, candidate_matrix)

Este enfoque nos permitió coincidir vacantes y currículos de manera más precisa, minimizando la cantidad de datos que necesitábamos almacenar. Pudimos mantener solo representaciones «comprimidas» de vacantes y currículos, lo que redujo significativamente la carga en nuestra base de datos.

Cambios en el producto

Después de implementar el nuevo algoritmo, notamos una mejora significativa en la calidad de los resultados de búsqueda. Los candidatos comenzaron a recibir más propuestas relevantes, y los reclutadores notaron un aumento en la calidad de la selección. Esto tuvo un impacto positivo en la experiencia del usuario, lo que a su vez se reflejó en las métricas de las secciones /jobs y /for-companies. Estamos seguros de que estos cambios nos ayudarán a fortalecer nuestra posición en el mercado.

Lecciones aprendidas

El uso de algoritmos simples puede llevar a una ineficiencia insuficiente.
La semántica contextual es más importante que la frecuencia de aparición de palabras.
La compresión de datos permite reducir los costos de almacenamiento.
La retroalimentación de los usuarios es un factor crucial para mejorar el producto.
No temáis probar diferentes enfoques: a veces, la mejor solución puede ser inesperada.

Importancia para los candidatos

Los candidatos ahora pueden contar con propuestas más precisas y relevantes. Gracias al algoritmo mejorado, sus posibilidades de ser notados por los reclutadores aumentan, lo que hace que el proceso de búsqueda de empleo sea más eficiente y agradable.

Importancia para los reclutadores

Los reclutadores tienen acceso a candidatos de mayor calidad, lo que minimiza el tiempo dedicado a la búsqueda. El sistema de coincidencia mejorado les permite encontrar currículos adecuados más rápidamente, lo que aumenta la productividad general del trabajo.

Próximos pasos

A pesar del progreso logrado, seguimos monitoreando los resultados del nuevo algoritmo. Planeamos realizar experimentos adicionales para entender cómo podemos seguir mejorando la calidad de la coincidencia sin aumentar la cantidad de datos almacenados. Si tuviéramos que empezar de nuevo, prestaríamos más atención a la retroalimentación en las primeras etapas de desarrollo para evitar algunos errores anteriores. ---

También en Fitlane AI

Temas: сравнение вакансий и резюме, хранение данных, оптимизация процессов, машинное обучение, алгоритмы сопоставления, Fitlane AI, платформа для подбора кадров

Todos los artículos