{"id":3910,"date":"2025-06-23T16:25:41","date_gmt":"2025-06-23T14:25:41","guid":{"rendered":"https:\/\/exceltic.com\/?p=3910"},"modified":"2026-03-19T13:28:24","modified_gmt":"2026-03-19T12:28:24","slug":"generative-ia-with-full-control-small-slms-language-models-and-quantisation-2","status":"publish","type":"post","link":"https:\/\/exceltic.serquo.com\/en\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/","title":{"rendered":"Generative AI with Total Control: Small Language Models (SLMs) and Quantization"},"content":{"rendered":"\n<p class=\"has-medium-font-size wp-block-paragraph\">La generaci\u00f3n IA ha cambiado la forma en que interactuamos con la tecnolog\u00eda, pero su amplio uso presenta retos en t\u00e9rminos de privacidad, gobernanza y eficiencia de recursos. En este art\u00edculo examinaremos c\u00f3mo los los Peque\u00f1os Modelos de Lenguaje (SLMs) ofrecen una alternativa m\u00e1s controlada y eficaz a los Modelos de lenguaje Grandes (LLM) y c\u00f3mo la cuantificaci\u00f3n de modelos puede mejorar a\u00fan m\u00e1s el rendimiento de estos.<\/p>\n\n\n\n<h2 class=\"wp-block-heading has-tertiary-color has-text-color has-link-color has-large-font-size wp-elements-e76b0c190fbc11e2b681060fe0464846\">\u00bfQu\u00e9 son los SLM?<\/h2>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Los Small Language Models (SLM) son modelos de lenguaje entrenados con una arquitectura similar a los LLMs pero con un n\u00famero mucho menor de par\u00e1metros para el procesamiento, comprenci\u00f3n y generaci\u00f3n de contenidos mediante lenguaje natural.<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Estas son las ventajas de otorga variedades:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>Bajo consumo de recursos (RAM\/CPU\/GPU)<\/strong>: requieren menos potencia de procesamiento, lo que facilita su implementaci\u00f3n en hardware m\u00e1s accesible.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Mayor control<\/strong>: pueden utilizarse tanto en entornos locales como privados, lo que <\/li>\n\n\n\n<li class=\"has-medium-font-size\">garantiza una mayor seguridad y gobernanza.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Mayor velocidad inferencial<\/strong>: las respuestas se generan de forma m\u00e1s r\u00e1pida y eficiente al tener menos par\u00e1metros.<\/li>\n<\/ul>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Ejemplos de SLMs conocidos: <\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>Mistral 7B<\/strong><\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Phi-2<\/strong> de Microsoft (~2.7B par\u00e1metros)<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>TinyLLaMA<\/strong><\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Gemma 2B<\/strong> de Google<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading has-large-font-size\">Cuantizaci\u00f3n del Modelo: Reducci\u00f3n del Tama\u00f1o sin Mortalidad Precisa <\/h2>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Uno de los principales obst\u00e1culos para entrenar modelos de IA es su tama\u00f1o y la capacidad de procesamiento requerida. Aqu\u00ed, la cuantificaci\u00f3n desempe\u00f1a un papel fundamental. Esta t\u00e9cnica disminuye el tama\u00f1o del modelo convirtiendo pesos de alta precisi\u00f3n (FP32, FP16) en pesos de baja precisi\u00f3n (INT8, INT4) sin afectar significativamente al rendimiento del modelo. Entre sus ventajas se encuentran:<\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>Reducci\u00f3n del uso de memoria<\/strong>: Permite almacenar y gestionar modelos en dispositivos con capacidad limitada.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Mayor eficiencia de la GPU\/CPU:<\/strong> Reduce la carga de la CPU acelerando las operaciones matem\u00e1ticas.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Inferencia acelerada:<\/strong> Los modelos pueden reaccionar m\u00e1s r\u00e1pidamente, disminuyendo la precisi\u00f3n de los c\u00e1lculos.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading has-large-font-size\">Comparaci\u00f3n de SLM y LLM<\/h2>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Aunque LLM ha demostrado ser una herramienta potente, SLM ofrece importantes ventajas en situaciones en las que la eficiencia y la privacidad son fundamentales. A continuaci\u00f3n, comparamos los dos enfoques:<\/p>\n\n\n\n<figure class=\"wp-block-image size-full\"><img loading=\"lazy\" decoding=\"async\" width=\"741\" height=\"426\" src=\"https:\/\/exceltic.com\/wp-content\/uploads\/2025\/06\/tabla-comparacion-SLM-y-LLM.png\" alt=\"\" class=\"wp-image-3911\" srcset=\"https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/tabla-comparacion-SLM-y-LLM.png 741w, https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/tabla-comparacion-SLM-y-LLM-300x172.png 300w, https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/tabla-comparacion-SLM-y-LLM-18x10.png 18w\" sizes=\"auto, (max-width: 741px) 100vw, 741px\" \/><\/figure>\n\n\n\n<h2 class=\"wp-block-heading has-large-font-size\">Generaci\u00f3n Aumentada por Recuperaci\u00f3n (RAG)<\/h2>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">La t\u00e9cnica de Generaci\u00f3n Aumentada por Recuperaci\u00f3n (RAG) se utiliza para mejorar la precisi\u00f3n y la contextualizaci\u00f3n de los modelos. Este m\u00e9todo maximiza las respuestas obteniendo informaci\u00f3n de fuentes adicionales y mejora el contexto antes de la generaci\u00f3n del texto. Su estructura consiste en:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>Chunking<\/strong>: fragmentaci\u00f3n de los datos en partes manejables.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Embeddings de documentos<\/strong>: conversi\u00f3n de texto en vector num\u00e9rico.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Base de datos vectorial (VectorDB)<\/strong>: <strong>)<\/strong>: es una base de datos que almacena y recupera datos relevantes.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Recuperaci\u00f3n de la informaci\u00f3n<\/strong>: ante una consulta, localiza los fragmentos de informaci\u00f3n m\u00e1s relevantes.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Generaci\u00f3n de respuestas<\/strong>: s\u00edntesis de informaci\u00f3n contextualizada para mejorar la salida del modelo.<\/li>\n<\/ol>\n\n\n\n<h2 class=\"wp-block-heading has-large-font-size\">Implementaci\u00f3n de SLMs + RAG: Un Modelo Eficiente y Seguro<\/h2>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">La combinaci\u00f3n de SLMs con la estrategia RAG permite crear sistemas de IA generativa altamente eficaces y controlables. Con esta arquitectura, las organizaciones pueden utilizar modelos optimizados que garantizan una mayor privacidad a la vez que utilizan menos recursos.<\/p>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">Beneficios Claves:<\/h3>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\">&nbsp;<strong>Uso optimizado de los datos<\/strong>: la inclusi\u00f3n de la recuperaci\u00f3n de informaci\u00f3n permite respuestas m\u00e1s precisas y fundamentadas.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Control total sobre el modelo:<\/strong> evita la necesidad de servicios de terceros y permite personalizar el comportamiento de la IA.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Ejecuci\u00f3n en entornos restringidos:<\/strong> debido a su cuantificaci\u00f3n y menor tama\u00f1o, los SLM pueden implementarse en dispositivos edge o servidores locales.<\/li>\n<\/ul>\n\n\n\n<h2 class=\"wp-block-heading has-large-font-size\">Arquitectura B\u00e1sica con Modelo Cuantizado, LangChain, RAG y FastAPI<\/h2>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Se puede utilizar la siguiente arquitectura para crear un entorno SML eficiente:<\/p>\n\n\n\n<ol class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>Carga del modelo cuantizado:<\/strong> para optimizar su rendimiento se utiliza un modelo que se ha cuantizado previamente en INT8 o INT4.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>LangChain para una gesti\u00f3n de prompts<\/strong>: LangChain permite estructurar y ampliar las peticiones del modelo.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Utilizaci\u00f3n del RAG para recuperaci\u00f3n aumentad<\/strong>a: hace uso de bases de datos vectoriales para mejorar el contexto de las respuestas.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"> <strong>API REST con FastAPI:<\/strong> este modelo explica c\u00f3mo utilizar una API para facilitar la integraci\u00f3n con otras aplicaciones.<\/li>\n<\/ol>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">C\u00f3digo de ejemplo:<\/h3>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">from fastapi import FastAPI, HTTPException<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">from langchain.chains import RetrievalQA<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">from langchain.vectorstores import FAISS<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">from langchain.embeddings import HuggingFaceEmbeddings<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">from langchain.llms import HuggingFacePipeline<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">import torch<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"># Cargar modelo cuantizado<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">tokenizer = AutoTokenizer.from_pretrained(\u00abmodelo-cuantizado\u00bb)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">model = AutoModelForCausalLM.from_pretrained(\u00abmodelo-cuantizado\u00bb, torch_dtype=torch.int8)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">pipe = pipeline(\u00abtext-generation\u00bb, model=model, tokenizer=tokenizer)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">llm = HuggingFacePipeline(pipeline=pipe)<\/p>\n\n\n\n<p class=\"wp-block-paragraph\"><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"># Cargar base de datos vectorial para RAG<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">embeddings = HuggingFaceEmbeddings(\u00absentence-transformers\/all-MiniLM-L6-v2\u00bb)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">db = FAISS.load_local(\u00abruta_vector_db\u00bb, embeddings)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">retriever = db.as_retriever()<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">qa_chain = RetrievalQA(llm=llm, retriever=retriever)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">app = FastAPI()<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">@app.post(\u00ab\/generar\u00bb)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">def generar_respuesta(prompt: str, max_length: int = 100):<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; try:<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; respuesta = qa_chain.run(prompt)<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; return {\u00abrespuesta\u00bb: respuesta}<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; except Exception as e:<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; raise HTTPException(status_code=500, detail=str(e))<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">if __name__ == \u00ab__main__\u00bb:<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; import uvicorn<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; uvicorn.run(app, host=\u00bb0.0.0.0&#8243;, port=8000)<\/p>\n\n\n\n<h2 class=\"wp-block-heading has-large-font-size\">Explicaci\u00f3n<\/h2>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">1. Carga del modelo cuantizado<\/h3>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>tokenizer = AutoTokenizer.from_pretrained(\u00abmodelo-cuantizado\u00bb)<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>model = AutoModelForCausalLM.from_pretrained(\u00abmodelo-cuantizado\u00bb, torch_dtype=torch.int8)<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>pipe = pipeline(\u00abtext-generation\u00bb, model=model, tokenizer=tokenizer)<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>llm = HuggingFacePipeline(pipeline=pipe)<\/em><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>AutoTokenizer.from_pretrained(\u00abmodelo-cuantizado\u00bb): <\/strong>Carga el tokenizador del modelo cuantizado.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong> AutoModelForCausalLM.from_pretrained(\u00abmodelo-cuantizado\u00bb, torch_dtype=torch.int8): <\/strong>Carga el modelo cuantizado en precisi\u00f3n int8, lo que reduce el uso de memoria y acelera la inferencia.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>pipeline(\u00abtext-generation\u00bb, model=model, tokenizer=tokenizer):<\/strong> Crea un pipeline de generaci\u00f3n de texto basado en el modelo cuantizado.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>HuggingFacePipeline(pipeline=pipe):<\/strong> Integra el pipeline en LangChain para su uso posterior en la arquitectura RAG.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">2. Configuraci\u00f3n de RAG (Retrieval-Augmented Generation):<\/h3>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>embeddings = HuggingFaceEmbeddings(\u00absentence-transformers\/all-MiniLM-L6-v2\u00bb)<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>db = FAISS.load_local(\u00abruta_vector_db\u00bb, embeddings)<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>retriever = db.as_retriever()<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>qa_chain = RetrievalQA(llm=llm, retriever=retriever<strong>)<\/strong><\/em><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>HuggingFaceEmbeddings(\u00absentence-transformers\/all-MiniLM-L6-v2\u00bb): <\/strong>Usa un modelo de embeddings (MiniLM-L6-v2) para convertir texto en representaciones vectoriales.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>FAISS.load_local(\u00abruta_vector_db\u00bb, embeddings): <\/strong>Carga una base de datos vectorial FAISS con embeddings previamente generados.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>db.as_retriever():<\/strong> Convierte la base de datos en un motor de b\u00fasqueda para recuperar informaci\u00f3n relevante.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>RetrievalQA(llm=llm, retriever=retriever)<\/strong>: Combina el modelo de lenguaje cuantizado con la recuperaci\u00f3n de informaci\u00f3n para mejorar la generaci\u00f3n de respuestas.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">3. Creaci\u00f3n de la API con FastAPI:<\/h3>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>app = FastAPI()<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>@app.post(\u00ab\/generar\u00bb)<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>def generar_respuesta(prompt: str, max_length: int = 100):<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; try:<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; respuesta = qa_chain.run(prompt)<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; return {\u00abrespuesta\u00bb: respuesta}<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; except Exception as e:<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>&nbsp;&nbsp;&nbsp; &nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; raise HTTPException(status_code=500, detail=str(e))<\/em><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><strong>FastAPI(): <\/strong>Crea una API REST para exponer el modelo y la funcionalidad RAG<strong>.<\/strong><\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>@app.post(\u00ab\/generar\u00bb):<\/strong> Define un endpoint \/generar que acepta solicitudes POST con un prompt de entrada.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>qa_chain.run(prompt): <\/strong>Usa la combinaci\u00f3n de recuperaci\u00f3n de informaci\u00f3n (RAG) y generaci\u00f3n de texto para responder.<\/li>\n\n\n\n<li class=\"has-medium-font-size\"><strong>Manejo de excepciones:<\/strong> Si ocurre un error, se devuelve un c\u00f3digo HTTP 500 con el mensaje de error.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">4. Ejecuci\u00f3n del servidor:<\/h3>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>if __name__ == \u00ab__main__\u00bb:<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>&nbsp;&nbsp;&nbsp; import uvicorn<\/em><\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\"><em>&nbsp;&nbsp;&nbsp; uvicorn.run(app, host=\u00bb0.0.0.0&#8243;, port=8000)<\/em><\/p>\n\n\n\n<ul class=\"wp-block-list\">\n<li class=\"has-medium-font-size\"><code><strong>uvicorn.run(app, host=\"0.0.0.0\", port=8000)<\/strong><\/code>: Inicia el servidor en el puerto 8000, permitiendo el acceso a la API.<\/li>\n<\/ul>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">Conclusi\u00f3n<\/h3>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Las empresas y los desarrolladores pueden ahora adoptar <strong>modelos m\u00e1s ligeros, r\u00e1pidos y privados gracias a los SLM (Small Language Models)<\/strong>, un avance clave en la evoluci\u00f3n de la IA generativa. La <strong>cuantizaci\u00f3n de modelos<\/strong> \u2014que reduce significativamente el tama\u00f1o y los requisitos computacionales sin comprometer el rendimiento b\u00e1sico\u2014 permite ejecutar estos modelos en entornos <strong>on-premise<\/strong> o en dispositivos con recursos limitados, manteniendo el control total sobre los datos y procesos.<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">A este enfoque se suma la arquitectura basada en <strong>RAG (Retrieval-Augmented Generation)<\/strong>, junto con herramientas como <strong>FastAPI y LangChain<\/strong>, que permiten desplegar soluciones de IA gobernables, auditables y adaptadas a requisitos espec\u00edficos. Estas estrategias hacen posible una <strong>generaci\u00f3n de IA totalmente controlada<\/strong>, convirti\u00e9ndola en una opci\u00f3n realista y eficaz para sectores exigentes como el an\u00e1lisis de datos, la investigaci\u00f3n cient\u00edfica o el servicio al cliente.<\/p>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">La combinaci\u00f3n de SLMs cuantizados, arquitectura modular y despliegue aut\u00f3nomo representa una de las formas m\u00e1s seguras y eficientes de integrar IA generativa en su organizaci\u00f3n.<\/p>\n\n\n\n<h3 class=\"wp-block-heading has-medium-large-font-size\">\u00bfQuieres ver c\u00f3mo se traduce todo esto en un caso real?<\/h3>\n\n\n\n<p class=\"has-medium-font-size wp-block-paragraph\">Accede a la ponencia completa y desc\u00fabrelo.<\/p>\n\n\n<div class=\"wpforms-container wpforms-container-full wpforms-block wpforms-block-0479e51e-0ca1-4f8c-8b97-091019a9064a\" id=\"wpforms-3927\"><form id=\"wpforms-form-3927\" class=\"wpforms-validate wpforms-form wpforms-ajax-form\" data-formid=\"3927\" method=\"post\" enctype=\"multipart\/form-data\" action=\"\/en\/wp-json\/wp\/v2\/posts\/3910\" data-token=\"f0c8eccf9c530cd1ea915afbf6f8071c\" data-token-time=\"1784128814\"><noscript class=\"wpforms-error-noscript\">Please enable JavaScript in your browser to complete this form.<\/noscript><div class=\"wpforms-field-container\"><div id=\"wpforms-3927-field_1-container\" class=\"wpforms-field wpforms-field-text ocultar-urlASUNTO\" data-field-id=\"1\"><label class=\"wpforms-field-label\" for=\"wpforms-3927-field_1\">Asunto <span class=\"wpforms-required-label\">*<\/span><\/label><input type=\"text\" id=\"wpforms-3927-field_1\" class=\"wpforms-field-large wpforms-field-required\" name=\"wpforms[fields][1]\" value=\"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n\" required><\/div><div id=\"wpforms-3927-field_2-container\" class=\"wpforms-field wpforms-field-text\" data-field-id=\"2\"><label class=\"wpforms-field-label wpforms-label-hide\" for=\"wpforms-3927-field_2\">Nombre <span class=\"wpforms-required-label\">*<\/span><\/label><input type=\"text\" id=\"wpforms-3927-field_2\" class=\"wpforms-field-large wpforms-field-required\" name=\"wpforms[fields][2]\" placeholder=\"Nombre\" required><\/div><div id=\"wpforms-3927-field_3-container\" class=\"wpforms-field wpforms-field-text\" data-field-id=\"3\"><label class=\"wpforms-field-label wpforms-label-hide\" for=\"wpforms-3927-field_3\">Apellidos <span class=\"wpforms-required-label\">*<\/span><\/label><input type=\"text\" id=\"wpforms-3927-field_3\" class=\"wpforms-field-large wpforms-field-required\" name=\"wpforms[fields][3]\" placeholder=\"Apellido\" required><\/div><div id=\"wpforms-3927-field_4-container\" class=\"wpforms-field wpforms-field-text\" data-field-id=\"4\"><label class=\"wpforms-field-label wpforms-label-hide\" for=\"wpforms-3927-field_4\"> Correo electr\u00f3nico <span class=\"wpforms-required-label\">*<\/span><\/label><input type=\"text\" id=\"wpforms-3927-field_4\" class=\"wpforms-field-large wpforms-field-required\" name=\"wpforms[fields][4]\" placeholder=\"Correo electr\u00f3nico\" required><\/div><div id=\"wpforms-3927-field_5-container\" class=\"wpforms-field wpforms-field-text\" data-field-id=\"5\"><label class=\"wpforms-field-label wpforms-label-hide\" for=\"wpforms-3927-field_5\">Tel\u00e9fono de contacto <\/label><input type=\"text\" id=\"wpforms-3927-field_5\" class=\"wpforms-field-large\" name=\"wpforms[fields][5]\" placeholder=\"Tel\u00e9fono de contacto\" ><\/div><div id=\"wpforms-3927-field_6-container\" class=\"wpforms-field wpforms-field-checkbox boxtransparent\" data-field-id=\"6\"><label class=\"wpforms-field-label wpforms-label-hide\">\u00bfAcepta las pol\u00edticas de privacidad? <span class=\"wpforms-required-label\">*<\/span><\/label><ul id=\"wpforms-3927-field_6\" class=\"wpforms-field-required\"><li class=\"choice-1 depth-1\"><input type=\"checkbox\" id=\"wpforms-3927-field_6_1\" name=\"wpforms[fields][6][]\" value=\"He le\u00eddo y acepto la pol\u00edtica de privacidad\" required ><label class=\"wpforms-field-label-inline\" for=\"wpforms-3927-field_6_1\">He le\u00eddo y acepto la pol\u00edtica de privacidad <span class=\"wpforms-required-label\">*<\/span><\/label><\/li><\/ul><div class=\"wpforms-field-description wpforms-disclaimer-description\"><b>IMPORTANTE:<\/b> Lea nuestra <a href='https:\/\/exceltic.com\/politica-de-privacidad\/' target='_blank' style=\"color: #e74b10;\" >Pol\u00edtica de Privacidad<\/a> antes de proceder. La informaci\u00f3n que facilite puede contener informaci\u00f3n de car\u00e1cter personal.<\/div><\/div><\/div><!-- .wpforms-field-container --><div class=\"wpforms-recaptcha-container wpforms-is-recaptcha wpforms-is-recaptcha-type-v2\" ><div class=\"g-recaptcha\" data-sitekey=\"6Lf9t3srAAAAAEstc-76vP4_LAvjdEbLQwgAri5D\"><\/div><input type=\"text\" name=\"g-recaptcha-hidden\" class=\"wpforms-recaptcha-hidden\" style=\"position:absolute!important;clip:rect(0,0,0,0)!important;height:1px!important;width:1px!important;border:0!important;overflow:hidden!important;padding:0!important;margin:0!important;\" data-rule-recaptcha=\"1\"><\/div><div class=\"wpforms-submit-container\" ><input type=\"hidden\" name=\"wpforms[id]\" value=\"3927\"><input type=\"hidden\" name=\"page_title\" value=\"\"><input type=\"hidden\" name=\"page_url\" value=\"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/posts\/3910\"><input type=\"hidden\" name=\"url_referer\" value=\"\"><button type=\"submit\" name=\"wpforms[submit]\" id=\"wpforms-submit-3927\" class=\"wpforms-submit\" data-alt-text=\"Enviando...\" data-submit-text=\"Enviar\" aria-live=\"assertive\" value=\"wpforms-submit\">Enviar<\/button><img loading=\"lazy\" decoding=\"async\" src=\"https:\/\/exceltic.serquo.com\/wp-content\/plugins\/wpforms-lite\/assets\/images\/submit-spin.svg\" class=\"wpforms-submit-spinner\" style=\"display: none;\" width=\"26\" height=\"26\" alt=\"Loading\"><\/div><\/form><\/div>  <!-- .wpforms-container -->","protected":false},"excerpt":{"rendered":"<p>Implement generative AI with small, quantified models. Gain efficiency, privacy and full control with SLM and RAG in secure environments.<\/p>","protected":false},"author":1,"featured_media":3916,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3],"tags":[],"class_list":["post-3910","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-eventos"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v28.0 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n -<\/title>\n<meta name=\"description\" content=\"Implementa IA generativa con modelos peque\u00f1os y cuantizados. Gana eficiencia, privacidad y control total con SLM y RAG en entornos seguros.\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/exceltic.serquo.com\/en\/generative-ia-with-full-control-small-slms-language-models-and-quantisation-2\/\" \/>\n<meta property=\"og:locale\" content=\"en_GB\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n -\" \/>\n<meta property=\"og:description\" content=\"Implementa IA generativa con modelos peque\u00f1os y cuantizados. Gana eficiencia, privacidad y control total con SLM y RAG en entornos seguros.\" \/>\n<meta property=\"og:url\" content=\"https:\/\/exceltic.serquo.com\/en\/generative-ia-with-full-control-small-slms-language-models-and-quantisation-2\/\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/exceltic\/\" \/>\n<meta property=\"article:published_time\" content=\"2025-06-23T14:25:41+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2026-03-19T12:28:24+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/portada-blog-ia-generativa.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1920\" \/>\n\t<meta property=\"og:image:height\" content=\"1080\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Serquo Admin\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:creator\" content=\"@exceltic\" \/>\n<meta name=\"twitter:site\" content=\"@exceltic\" \/>\n<meta name=\"twitter:label1\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data1\" content=\"Serquo Admin\" \/>\n\t<meta name=\"twitter:label2\" content=\"Estimated reading time\" \/>\n\t<meta name=\"twitter:data2\" content=\"8 minutes\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/\"},\"author\":{\"name\":\"Serquo Admin\",\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/#\\\/schema\\\/person\\\/aa4f97f58379cc64179590f276472ad5\"},\"headline\":\"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n\",\"datePublished\":\"2025-06-23T14:25:41+00:00\",\"dateModified\":\"2026-03-19T12:28:24+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/\"},\"wordCount\":1557,\"image\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/exceltic.serquo.com\\\/wp-content\\\/uploads\\\/2025\\\/06\\\/portada-blog-ia-generativa.png\",\"articleSection\":[\"Eventos\"],\"inLanguage\":\"en-GB\"},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/\",\"url\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/\",\"name\":\"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n -\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/exceltic.serquo.com\\\/wp-content\\\/uploads\\\/2025\\\/06\\\/portada-blog-ia-generativa.png\",\"datePublished\":\"2025-06-23T14:25:41+00:00\",\"dateModified\":\"2026-03-19T12:28:24+00:00\",\"author\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/#\\\/schema\\\/person\\\/aa4f97f58379cc64179590f276472ad5\"},\"description\":\"Implementa IA generativa con modelos peque\u00f1os y cuantizados. Gana eficiencia, privacidad y control total con SLM y RAG en entornos seguros.\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/#breadcrumb\"},\"inLanguage\":\"en-GB\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"en-GB\",\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/#primaryimage\",\"url\":\"https:\\\/\\\/exceltic.serquo.com\\\/wp-content\\\/uploads\\\/2025\\\/06\\\/portada-blog-ia-generativa.png\",\"contentUrl\":\"https:\\\/\\\/exceltic.serquo.com\\\/wp-content\\\/uploads\\\/2025\\\/06\\\/portada-blog-ia-generativa.png\",\"width\":1920,\"height\":1080},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Portada\",\"item\":\"https:\\\/\\\/exceltic.serquo.com\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/#website\",\"url\":\"https:\\\/\\\/exceltic.serquo.com\\\/\",\"name\":\"\",\"description\":\"Ingenier\u00eda y Consultor\u00eda\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/exceltic.serquo.com\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"en-GB\"},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/exceltic.serquo.com\\\/#\\\/schema\\\/person\\\/aa4f97f58379cc64179590f276472ad5\",\"name\":\"Serquo Admin\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"en-GB\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c335bd9da7b1e9a671364c54e17ba39cb4a646b8eb953383973649c257b1fe49?s=96&d=mm&r=g\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c335bd9da7b1e9a671364c54e17ba39cb4a646b8eb953383973649c257b1fe49?s=96&d=mm&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/c335bd9da7b1e9a671364c54e17ba39cb4a646b8eb953383973649c257b1fe49?s=96&d=mm&r=g\",\"caption\":\"Serquo Admin\"},\"url\":\"https:\\\/\\\/exceltic.serquo.com\\\/en\\\/author\\\/serquo\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Generative AI with Total Control: Small Language Models (SLMs) and Quantization","description":"Implement generative AI with small, quantified models. Gain efficiency, privacy and full control with SLM and RAG in secure environments.","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/exceltic.serquo.com\/en\/generative-ia-with-full-control-small-slms-language-models-and-quantisation-2\/","og_locale":"en_GB","og_type":"article","og_title":"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n -","og_description":"Implementa IA generativa con modelos peque\u00f1os y cuantizados. Gana eficiencia, privacidad y control total con SLM y RAG en entornos seguros.","og_url":"https:\/\/exceltic.serquo.com\/en\/generative-ia-with-full-control-small-slms-language-models-and-quantisation-2\/","article_publisher":"https:\/\/www.facebook.com\/exceltic\/","article_published_time":"2025-06-23T14:25:41+00:00","article_modified_time":"2026-03-19T12:28:24+00:00","og_image":[{"width":1920,"height":1080,"url":"https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/portada-blog-ia-generativa.png","type":"image\/png"}],"author":"Serquo Admin","twitter_card":"summary_large_image","twitter_creator":"@exceltic","twitter_site":"@exceltic","twitter_misc":{"Written by":"Serquo Admin","Estimated reading time":"8 minutes"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/#article","isPartOf":{"@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/"},"author":{"name":"Serquo Admin","@id":"https:\/\/exceltic.serquo.com\/#\/schema\/person\/aa4f97f58379cc64179590f276472ad5"},"headline":"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n","datePublished":"2025-06-23T14:25:41+00:00","dateModified":"2026-03-19T12:28:24+00:00","mainEntityOfPage":{"@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/"},"wordCount":1557,"image":{"@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/#primaryimage"},"thumbnailUrl":"https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/portada-blog-ia-generativa.png","articleSection":["Eventos"],"inLanguage":"en-GB"},{"@type":"WebPage","@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/","url":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/","name":"Generative AI with Total Control: Small Language Models (SLMs) and Quantization","isPartOf":{"@id":"https:\/\/exceltic.serquo.com\/#website"},"primaryImageOfPage":{"@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/#primaryimage"},"image":{"@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/#primaryimage"},"thumbnailUrl":"https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/portada-blog-ia-generativa.png","datePublished":"2025-06-23T14:25:41+00:00","dateModified":"2026-03-19T12:28:24+00:00","author":{"@id":"https:\/\/exceltic.serquo.com\/#\/schema\/person\/aa4f97f58379cc64179590f276472ad5"},"description":"Implement generative AI with small, quantified models. Gain efficiency, privacy and full control with SLM and RAG in secure environments.","breadcrumb":{"@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/#breadcrumb"},"inLanguage":"en-GB","potentialAction":[{"@type":"ReadAction","target":["https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/"]}]},{"@type":"ImageObject","inLanguage":"en-GB","@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/#primaryimage","url":"https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/portada-blog-ia-generativa.png","contentUrl":"https:\/\/exceltic.serquo.com\/wp-content\/uploads\/2025\/06\/portada-blog-ia-generativa.png","width":1920,"height":1080},{"@type":"BreadcrumbList","@id":"https:\/\/exceltic.serquo.com\/ia-generativa-con-control-total-pequenos-modelos-de-lenguaje-slms-y-cuantizacion-2\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Portada","item":"https:\/\/exceltic.serquo.com\/"},{"@type":"ListItem","position":2,"name":"IA Generativa con Control Total: Peque\u00f1os Modelos de Lenguaje (SLMs) y Cuantizaci\u00f3n"}]},{"@type":"WebSite","@id":"https:\/\/exceltic.serquo.com\/#website","url":"https:\/\/exceltic.serquo.com\/","name":"","description":"Engineering and Consulting","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/exceltic.serquo.com\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"en-GB"},{"@type":"Person","@id":"https:\/\/exceltic.serquo.com\/#\/schema\/person\/aa4f97f58379cc64179590f276472ad5","name":"Serquo Admin","image":{"@type":"ImageObject","inLanguage":"en-GB","@id":"https:\/\/secure.gravatar.com\/avatar\/c335bd9da7b1e9a671364c54e17ba39cb4a646b8eb953383973649c257b1fe49?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/c335bd9da7b1e9a671364c54e17ba39cb4a646b8eb953383973649c257b1fe49?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/c335bd9da7b1e9a671364c54e17ba39cb4a646b8eb953383973649c257b1fe49?s=96&d=mm&r=g","caption":"Serquo Admin"},"url":"https:\/\/exceltic.serquo.com\/en\/author\/serquo\/"}]}},"_links":{"self":[{"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/posts\/3910","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/comments?post=3910"}],"version-history":[{"count":10,"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/posts\/3910\/revisions"}],"predecessor-version":[{"id":3986,"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/posts\/3910\/revisions\/3986"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/media\/3916"}],"wp:attachment":[{"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/media?parent=3910"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/categories?post=3910"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/exceltic.serquo.com\/en\/wp-json\/wp\/v2\/tags?post=3910"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}