Desde la última vez que publique sobre el uso de la IA, es mucho lo que han mejorado y perfeccionado en cuanto a desempeño y exactitud. Precisamente hablando de exactitud, la mayoría hemos visto los errores que las IA cometen, especialmente en la generación de imágenes, sin embargo, con el tiempo ha mejorado y eso depende mucho de lo que hagamos y como la entrenamos.
Gems: Your Personal AI, Mastered
Since my last update on AI, the leap in performance and accuracy has been remarkable. We’ve all seen those AI glitches, particularly in image generation, but things are getting much better over time. It really comes down to how we guide and train the model.
Lo primero que hay que aclarar, que los resultados que busques en una IA seran más precisos, de acuerdo al modelo que dispongas de la misma. Si es el gratuito, tiene límites que solo están disponibles en las versiones pagas, sin embargo, hoy te enseñaré como entrenas el modelo de Gémini gratuito para que tengas los mejores resultados en cuanto a generación de imagen, aunque tú también aplica para todo.
First, it’s worth noting that your results will be more precise depending on the model you are using. While the free version has some limitations compared to the paid ones, today I’ll show you how to train the free version of Gemini to get top-tier results in image generation—though these tips apply to just about any task.
Las GEM de Gémini
En el universo de Google, una Gems es la versión personalizada de Gemini, que desarrollas para que se comporten de una manera específica. Podría decirse que funciona como un asistente personal en asuntos específicos, que no necesita darle contexto. Bien podría ser un entrenador personal, editor de texto, traductor, chef consultor, o generador de imagenes.
Gems in the Google ecosystem
In Google’s world, Gems are personalized versions of Gemini that you build to behave in a specific way. They function like personal assistants for specific niches without needing constant context. They can be anything: a personal trainer, a copy editor, a translator, a consultant chef, or an image generator.
🛠️ ¿Cómo crear tu propia Gem?
Crear una es bastante facil y no necesitas ser programador, basta con escribir una sencillas instrucciones, pero eso sí, lo más específicas que puedas.
How to create your own Gem
Making your own is quite simple and doesn't require any coding skills. You just need to write out some instructions—just make sure they are as detailed as possible.
El gran dato para disfrutar de esta herramienta con la versión gratuita, es que debes crearlas desde la versión web de Gémini, porque no la verás en la app a menos que tengas la versión paga.
The insider tip for using this tool on the free version is that you must create them via the web version of Gemini. You won’t find the option in the mobile app unless you’re on a paid plan.
Una vez ingrese a la web de Gémini, encontras Gems en la barra lateral o en el menú de "Configuración", busca la opción que dice Gems o el botón de "Nueva Gem".
Once you log in on the web, look for Gems in the sidebar or the Settings menu and click on the New Gem button.
Lo siguiente es darle un nombre, en mi caso la llamaré Dan porque quiero que sea un asistente para generar imágenes más exactas de mi. La clave para que eso ocurra está en como redacte la descripción, para eso debo ser específico cuando me describo a mi mismo.
The next step is to give it a name. I called mine Dan because I want an assistant that can generate accurate images of me. The key to making this work is the description; you have to be incredibly specific when describing yourself.
La otra gran clave es la Instrucción. Aquí en donde le indicamos qué debe hacer, qué tono debe usar y qué debe evitar. Yo en la descripción escribí lo siguiente:
"Tu objetivo es ayudar a crear imágenes de este GEMS de Dan, representa a un solo hombre, y debe mantener el 100% de sus rasgos reales en cada generación: facciones faciales, tono de piel, proporciones corporales, tipo de cabello y expresión natural. No alteres su fisonomía, ni la hagas parecer otra persona. Tal cual como está en tu base de conocimientos."
The other major factor is the Instruction. This is where you tell the AI exactly what to do, what tone to use, and what to avoid. In my description, I wrote the following:
Your goal is to help create images of this Gem, Dan. It represents a single man and must maintain 100% of his real features in every generation: facial features, skin tone, body proportions, hair type, and natural expression. Do not alter his appearance or make him look like someone else. Use him exactly as he appears in your knowledge base.
En la base de conocimiento debemos cargar las imágenes. Puedes subir hasta 10, asegúrate de colocar fotos de todos los perfiles para que pueda reconocer todos los detalles del rostro, esto para un modelo que genera imagen, pero si es otro tipo de asistencia, acá cargaras documentos, infografías, todo lo que necesites para entrenar el modelo.
In the knowledge base, we need to upload the images. You can add up to 10. I recommend using photos from all different angles so the model can recognize every detail of your face. If you were building a different kind of assistant, this is where you’d upload documents, infographics, or whatever else you need to train the model.
Una vez listo puede comenzar a generar imágenes de distintos tipos, te muestro algunos de los resultados que obtuve
Once everything is set, you can start generating various types of images. I’ve been able to get some great results.
✨ Tips que debes recordar para que tu Gem sea brillante
- Sé específico, escribe todos los detalles que puedas, ya que esto le dará mas "personalidad" y conocimientos, y será más exacta.
- Define el formato si es para imágenes, asistente que responda con listas, tablas, párrafos cortos, traductor, etc.
- Itera si no te gusta cómo responde, así que ve a las instrucciones en cualquier momento y ajustalas.
Tips for making your Gem shine
- Be specific: Write down every detail you can. This gives the Gem more personality and knowledge, leading to more accurate results.
- Define the format: Specify if you want images or if you want an assistant that responds with lists, tables, short paragraphs, or translations.
- Iterate: If you don’t like how it’s responding, go back to the instructions at any time and tweak them. It’s a process of constant refinement.
Photos taken by ©danielcarrerag copyright reserved. These images may not be reproduced, distributed or used without the express permission of the author.