Recordemos que en la Ciencia para obtener nuevos conocimientos se utiliza el método científico el cual consiste en un conjunto de pasos ordenados.

Del mismo modo para extraer la información que nos interesa de una Base de Datos usando Data Mining necesitamos seguir una serie de pasos.
El primer paso a seguir se le llama:
📌 INICIALIZACIÓN
El cual consiste en dos partes:
1️⃣ CONTEXTUALIZACION
El analista o Minero debe entender el contexto de los datos, esto quiere decir que debe entender cada una de las variables que se le presentan, la problemática, las razones y el objetivo del escenario.
Ya que si esto NO sucede las conclusiones pueden ser erróneas.
Cuando se nos presenta una Base de Datos es necesario conocer los impedimentos y fortalezas que tienen, al igual que la naturaleza de los datos y como fueron generados, ya que esto es importante al momento de dar las conclusiones.
⚠️ Tenemos que tener en cuenta que SIN DATOS NO HAY ANÁLISIS.

2️⃣ COLECCIÓN DE LOS DATOS
Una vez que ya conozcamos el contexto, es importante recabar los datos que estén relacionados con nuestro objetivo para posteriormente obtener una respuesta.
⭕ Las Maneras de recolectar los datos pueden ser:
✨ Voluntaria: Consiste en que el usuario es consciente de la metodología de obtención de información
Ejemplo: Cuestionarios, Entrevistas.
✨Involuntaria : El usuario no sabe el mecanismo de obtención de la información
Ejemplo: Rastreo de actividades.
⚠️ Tenemos que tener en cuenta que:
🔅Tener un solo conjunto de datos facilita la tarea, reduciendo los errores.
🔅Dos o más fuentes de información podría aumentar el margen de error al unir la información.
🔅Si se ocupa una fuente de información diferente a la propia, es probable que los resultados no reflejen la realidad.
🔅No existen Datos perfectos, pero si se recomienda diseñarlos desde el inicio.

