¿Qué es el análisis léxico y sintáctico?

  



En programación especialmente en la construcción de compiladores e intérpretes el análisis léxico y el análisis sintáctico son dos etapas fundamentales para entender y procesar código fuente. Aquí te lo explico de forma clara y con ejemplos simples.


___________________________________________________________________________


Análisis Léxico

El análisis léxico es la primera etapa del proceso de compilación o interpretación. Su objetivo principal es transformar el código fuente (texto plano) en una secuencia estructurada de tokens que luego serán utilizados en etapas posteriores.


¿Qué es realmente el análisis léxico?

Es un proceso que:

  1. Lee el código carácter por carácter

  2. Agrupa los caracteres en unidades lógicas (tokens)

  3. Clasifica y etiqueta cada token

  4. Elimina información irrelevante (espacios, saltos de línea, comentarios)

  5. Detecta errores léxicos (caracteres inválidos o mal formados)

Un analizador léxico también se conoce como lexerscanner o tokenizador.


__________________________________________________________________


Análisis Sintáctico

El análisis sintáctico es la segunda etapa. Toma los tokens generados por el análisis léxico y los organiza según la gramática del lenguaje.

Su objetivo es verificar que los tokens formen sentencias válidas y construir un árbol sintáctico.


¿Qué hace exactamente el análisis sintáctico?

  1. Recibe la secuencia de tokens

  2. Verifica que las combinaciones sigan las reglas de la gramática

  3. Construye estructuras internas:

    • Árbol de derivación

    • Árbol sintáctico (AST)

    • Árbol de análisis

  4. Señala errores sintácticos (estructura inválida)

  5. Ayuda a interpretar o compilar el código


Comentarios

Entradas más populares de este blog

Ejemplos de código en GeraScript

Lenguaje de programación GeraScript