viernes, 20 de diciembre de 2019

Los sistemas de búsqueda. Google.


Los sistemas de búsqueda. Google.  

Alejandro Villegas Sánchez. 
Álvaro Serrano Íñigo. 
Talía Lucero Azabache. 

En la actualidad hay una gran variedad de buscadores, como Bing, yahoo, y el que más importancia tiene, Google, que nos ayudan a localizar información sobre cualquier tema.  En primer lugar, hay que conocer como es el funcionamiento de los buscadores.  Con la gran variedad de información que hay en la web, sería difícil encontrar una información específica sin la ayuda de una herramienta. Con este propósito se crearon los sistemas de clasificación de Google. 
 Google posee dos sistemas de búsqueda de la información: 
*​Mediante palabras​: escribimos las palabras importantes en la página principal de Google. En la mayoría de buscadores realizamos la búsqueda por palabras.  

*​Mediante el directorio:​ nos traslada a un listado con las páginas más importantes de cada tema.  Es una buena opción si no queremos una información muy especializada.  





BIBLIOGRAFÍA:

¿Por qué google es el buscador más usado hoy en día y cuáles son sus utilidades para el usuario?

 El algoritmo de esta compañía es lo que hizo que tomara la suficiente ventaja sobre sus rivales como para desbancarlos de la competición por el top 1 de los buscadores. 

 https://pandorafms.com/blog/es/que-es-un-algoritmo/ 

Una de las grandes, por no decir la que más, ventajas aporta este buscador es lo que se conoce como el Page Rank, que viene a ser el clasificador de sitios web que el motor de búsqueda GOOGLE implementa. Page Rank es una idea genial para hallar el valor o "importancia" que tiene una página web determinada. Esta "importancia" se emplea después para mostrar los resultados de mayor calidad cuando realizamos una búsqueda en Google.


Es por esto y el propio algoritmo de GOOGLE, que el motor de búsqueda más usado del mundo sea este mismo. Pero claro, GOOGLE desde sus principios no siempre ha mantenido el mismo “look”, tanto por fuera (para el usuario), como por dentro ( el algoritmo). Y esto, de echo, es otra de las grandes razones de su gran victoria, el no tener miedo a innovar.   
Uno de los comportamientos que Google ha convertido en marca de la casa es su permanente innovación, su imagen de empresa vertiginosa que no deja de irrumpir de forma novedosa en uno y otro campo, siempre en el marco de las nuevas tecnologías y la comunicación.


 
Otra ventaja, y de las más notorias, aunque no para el usuario que consume, es la forma de trabajo de esta empresa. Dicen que el proceso de admisión de Google para nuevos empleados es duro, reclutan a sus cachorros directamente de las universidades para poder modelarlos a su imagen y porque así se aseguran jóvenes talentos con mucha capacidad de trabajo y sin cargas familiares. A esto se le suma una política de trabajo “distinta”. Monopatín, toboganes, videojuegos, referencias al talento, estímulos constantes…

http://blog.shareasale.com/2016/01/07/conferences-work-or-fun/


Google ha hecho de un entorno de trabajo divertido, estimulante y creativo. Los “googlers” cuentan con comedor y bebidas gratis, centro de salud, lavandería e incluso guardería dentro de la propia empresa, que además investiga permanentemente en nuevos incentivos que conceder a sus trabajadores.
Y con todas estas ventajas y más de estas, se forma una base lo suficientemente sólida como para formar el mejor motor de búsqueda en todo internet. Pero claro, sobre el propio usuario, ¿Qué utilidades aportan todas estas ventajas? 



Las funciones de Google son múltiples. ¿Necesitas saber el tiempo? ¿Una calle? ¿Quieres saber el significado de una palabra? ¿Quizá convertir monedas o unidades? ¿Te estás preguntando qué libros ha escrito un determinado autor?, fechas de nacimiento de famosos, grupos de música por un determinado estilo. En todas estas cosas y muchas más, Google puede ayudarle con una información precisa. 

También existen varias maneras de buscar más específicamente en Google, cuya solución es a través de comandos. 

Aunque Google ahora mapea los parámetros de búsqueda individuales directamente en el navegador a través de la búsqueda avanzada, tiene sentido tener listos los comandos de búsqueda de Google más importantes.

Creación de cadenas de palabras de búsqueda con comillas: las citas sólo se utilizan para buscar en el orden igual al que se han introducido. Excluir términos, como por ejemplo utilizando un “-“.
 
Especificar la búsqueda con los operandos “OR” o “AND”. OR devuelve resultados con diseño web o posicionamiento y AND de diseño web posicionamiento, en cristiano, una búsqueda estándar. 

Usando el comando “site” para encontrar un sitio web especifico o “inurl”, que devuelve resultados de sitios webs donde aparece la palabra SEO (con este comando  pueden buscar fácilmente cualquier temática, para ver que de que se está hablando sobre esa temática en concreto). 


Bibliografía: 




-Buscadores existentes.

 Gráficas de uso a nivel mundial. Actualmente hay una gran cantidad de buscadores en internet aparte de Google (el más conocido), pero, antes de ver estos, sería importante saber que es un buscador. 

Un buscador es un sistema informático el cual permite encontrar páginas web, según las palabras o la frase que hayamos ingresado, y este prácticamente en el mismo instante nos proporciona las páginas web que nos muestran la información buscada. Existen dos tipos de buscadores; los motores de búsqueda, y los índices temáticos. 
https://www.josegalan.es/wp-content/uploads/2017/04/buscadores-internet.jpg

En primer lugar, los motores de búsqueda, son los encargados de asociar lo que deseamos buscar mediante palabras clave. Son diferentes máquinas con software específicos que se encargan de la búsqueda de páginas que hay en su registro. Además, cuentan con las llamadas “arañas web”; programas dedicados a analizar internet automáticamente. 

Por otro lado, los índices temáticos, cuentan con un conjunto de personas las cuales se encargan de buscar la información manualmente en la red. 

Es importante saber que no todas las páginas web se encuentran en estos buscadores, a estas páginas se las conoce como “Internet profundo” o “Internet invisible”. 

Existen distintos tipos de buscadores como; Google, Bing, Yahoo, Alexa, Duckduckgo, Qwant, Yacy, etc. Y vamos a hablar de dos de ellos. Por un lado, Bing es un buscador web de Microsoft. Fue puesto en marcha por primera vez en junio de 2009. 

Este es una herramienta de búsqueda con un aspecto y funcionamiento nuevos y renovados, que ayuda a encontrar la información de forma más rápida y sencilla. Además, en España actualmente ofrece mejores resultados, y seguirá evolucionando a lo largo del tiempo. 


https://tecnoinnovador.com/wp-content/uploads/2016/01/apertura-bing-534x462.jpg


Por otro lado, Alexa Internet, Inc. Es una subsidiaria de Amazon con base en California. Esta es conocida porque provee información acerca del número de personas que ha visitado un sitio web y los clasifica en un ranking. Alexa también proporciona una gráfica donde se puede apreciar el crecimiento y decrecimiento de las visitas que recibe una página web, además de información diaria, una media semanal y cada tres meses. 

https://images-na.ssl-images-amazon.com/images/G/01/mobile-apps/dex/alexa/agencies/logo_alexa._CB520978690_.png


En cuanto al nivel de uso de los buscadores a nivel mundial en 2018 destacó el uso de Google. En esta gráfica que os presentamos a continuación; presenta la cuota de mercado de los principales
buscadores a nivel mundial. Google se situó en primer lugar con una cuota superior al 95%, seguido muy de lejos de Bing, con una cuota inferior al 3%. 

 
-Cómo encuentra Google el contenido buscado. 

Google sigue un esquema de tres pasos para generar resultados de la información buscada. 

El primer paso, consiste en conocer que tipo de páginas existen en la web. Como no cuentan con un registro central, tienen que buscar constantemente nuevas páginas web y añadirlas a una lista de páginas conocidas, proceso al cual se le denomina “rastreo”. 

El segundo paso, ocurre después de descubrir una página, el cual consiste en interpretar el contenido de esta, proceso llamado “indexación”. En este proceso, se analiza el contenido, se catalogan sus archivos de imágenes y vídeo y tratan de comprenderla. Toda la información recopilada se guarda en el “índice de Google”. 

Y el tercer y último paso se le denomina “publicación y posicionamiento”. Este proceso tiene lugar cuando los usuarios introducen sus consultas, y Google trata de encontrar la respuesta más adecuada en función de diversos factores. Para encontrar respuestas de mayor calidad se tienen en cuenta aspectos como; la ubicación, el
idioma, el dispositivo de los usuarios, con el objetivo de averiguar que resultado ofrecerá la mejor experiencia y la respuesta más adecuada. https://design.google/library/evolving-google-identity/
 
  -Bibliografía: 




 
 SEO Y SEM  

Para la supervivencia de un medio digital, es importante una buena visibilidad online. Puede beneficiar el poseer una estrategia SEO y SEM para medios digitales. 
                           
  
SEO (Search Engine Optimization)  

Conjunto de acciones en una web cuyo objetivo es mejorar la visibilidad y posicionamiento. 
Cuando un usuario busca una información en Google, este navegador envía sus bots a buscar las diversas páginas. Mediante un algoritmo, otorga una puntuación de la que se extrae una lista de resultados. 

El orden de esta, se basa principalmente en la velocidad de carga de la web. 
Para influir en esta puntuación, se puede realizas dos tipos de prácticas SEO: 

 *​SEO On Page​: acciones realizadas internamente en la web para mejorar su visibilidad y posicionamiento. Uso de palabras clave, o calidad y originalidad de la información. 
 *​SEO Off Page​: prácticas externas que tienen influencia en la notoriedad online. El tráfico producido por otras webs, redes sociales u otros. 
                              
https://cdn.pixabay.com/photo/2015/08/19/15/44/seo-896174_960_720.png
  
 
Dependiendo del tipo de acciones que realice el usuario para tomar posiciones, se recurre a uno de los siguientes SEO:  

* White Hat SEO
 Acciones lentas pero seguras, permitidas por Google para obtener un buen posicionamiento a largo plazo. 
Algunas de estas estrategias son: asegurarse de que la web se cargue rápidamente en los diferentes dispositivos; cada página de la web debe poseer una metadescripción; webs sin links con códigos de estado 404 o 303; escribir alt en el código html de las imágenes y hacer una breve descripción.  

* ​Black Hat SEO
 Acciones que buscan fallos en el algoritmo, altamente penalizadas por Google.
Hay muchas estrategias, pero las más usadas son: 
Cloacking​ : Se realiza un engaño al enseñar al usuario y al bot contenido diferente, con el objetivo de que se le posicione con un contenido de buena calidad. 
Spinning ​: Se realizan modificaciones de textos originales con mínimos cambios. Por ejemplo: uso de sinónimos. 
Textos ocultos: ​ La colocación de palabras con el mismo color del fondo.  
*Grey Hat SEO 
Conjunto de estrategias originadas por las dos anteriores. No están bien vistas, pero no son penalizadas. Algunas de las usadas son: realizar contenidos con una gran extensión con la intención de dar la impresión de calidad; comprar dominios con buena reputación para mejorar los backlinks; la creación de cuentas falsas en las redes sociales con el objetivo de aumentar seguidores; evitar una sobreoptimización de palabras clave. 
 

Buenas prácticas al hacer SEO  

1. El uso de un Sitemap.xml y Robots.txt de la página web para saber qué contenido rastrear.  
2. Realizar publicaciones con frecuencia, y crear contenido  
3. Crear una cuenta de trabajo en Google My Business.  
4. La corrección de errores en la web.  
5. Diseñar una web que mejore y facilite la navegación del usuario.  
6. Para una mayor velocidad reducir la cantidad de código.  
7. Asegurarse de que contenga responsive design. 
                ​

Malas prácticas al hacer SEO  

1. El poseer un contenido copiado de otras páginas web y contenido duplicado, perjudica en su posicionamiento.  
2. El uso exagerado de palabras clave da lugar a la carencia de sentido.  
3. Hoy en día el poseer una gran cantidad de links externos que redireccione a la página web, no es certeza de poseer un buen posicionamiento, ya que es más importante que sean fiables y de calidad. 
4. Crear comentarios como SPAM, que carecen de sentido y relación con el contenido.  
5. La metadescripción debe ser diferente en cada página.  
6. El no vincular las redes sociales no beneficia a la ganancia de clientes y movimiento en estas páginas web. 

https://almyfroes.com/wp-content/uploads/2013/02/google-spam.jpg

 
SEM (Search Engine Marketing)  

Son anuncios para promocionar páginas web y pueden ser pagadas o no. 
                                 

Hay diversos tipos según los negocios de estas páginas web:  

*CPM (Coste Por Mil impresiones​): se cobra por el número de veces que en la página web se ha visualizado el anuncio. 

*VCPM (Coste Por Mil impresiones vistas)​: en cada impresión el anuncio debe aparecer en la pantalla por lo menos el 75% con una duración de 5 segundos.  

*CPC (Coste Por Click​): cobra por cada click que se hace al anuncio.  

*CPL (Coste Por Lead)​:  se cobra cuando se hace click sobre el anuncio y después se realiza otro movimiento.  

*CPA (Coste por Adquisición)​: se paga al realizar una compra en la web.  

*Patrocinio​: se paga por mantener durante un tiempo un anuncio en una o diferente páginas web. 

VENTAJAS DEL SEM 
 
1. Beneficios a corto plazo. 
2. Google Ads realiza una estimación de los resultados previos según la inversión. Google Ads es una herramienta gratuita de Google utilizada para la publicidad. Es suficiente con poseer una cuenta de Google para utilizarla en diferentes acciones como: elegir el mensaje, la cantidad invertida y el modelo del negocio.  
3. Visualización del anuncio a un público determinado, con un mensaje específico y con un contenido atractivo. 
          
 

 DESVENTAJAS DEL SEM  

1. Para obtener buenos beneficios en algunas ocasiones es conveniente realizar inversiones elevadas. Aunque esto no asegura el éxito.  
2. Es necesaria poseer experiencia en estas prácticas para obtener los efectos esperados. 
 
 

BIBLIOGRAFÍA :



 

EL BUSINESS INTELLIGENCE

EL BUSINESS INTELLIGENCE EN LAS EMPRESAS ESPAÑOLAS 

Los sistemas Business Intelligence son herramientas que se utilizan para transformar información en conocimiento, con la finalidad de mejorar la toma de decisiones de las empresas.




Esta herramienta de crecimiento empresarias existe hoy en día en España, pero muy escasamente, ya que actualmente se está utilizando en grandes empresas y trasnacionales. Sin embargo, se piensa que en poco tiempo dará un giro, extendiéndose en más países e incluso en empresas de menor tamaño.  En otros países, debido a su gran cantidad de beneficios, es donde se encuentra en auge. 

El verdadero poder se encuentra en el comprender la información. El uso de estas herramientas provoca una mayor competitividad en el mercado, con respecto a otras empresas, ya que poseen información
privilegiada y saben cómo resolver diferentes problemas que puedan llegar a darse. 

La información que poseen estas empresas puede ser utilizada para crear perfiles de compra de los clientes más destacados, basados en: sus necesidades, deseos, tendencias … provocando una mejora en el servicio al cliente.



BIBLIOGRAFÍA:

miércoles, 11 de diciembre de 2019

Que es el business intelligence y su papel en la empresa

¿QUÉ ES EL BUSINESS INTELLIGENCE? 
El business intelligence (inteligencia de negocios en español) como bien indica su nombre, es la habilidad de transformar los datos en información, luego esa información en conocimiento de forma que pueda optimizar el proceso de la toma de decisiones en la empresa o en los negocios.

Aunque desde un punto de vista pragmático, podemos definir este concepto como un conjunto de metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar información desestructurada en información estructurada, para la explotación posterior de esta o análisis y conversión en conocimiento, dando así apoyo a la toma de decisiones sobre el negocio.

Claro, esto dar a confusiones con lo que también conocemos como el Big Data, así que por que no, ¿cómo diferenciar uno de otro?






Fuente: https://www.iebschool.com/blog/wp-content/uploads/2019/02/BIG-DATA.png







-En un entorno big data, los datos se van a almacenar en un sistema de ficheros distribuido, en lugar de un servidor.
- Las soluciones del Big Data llevan las funciones de proceso a los datos, en lugar de los datos a las funciones.
-Los datos procesados por las soluciones de Big Data pueden ser históricos o provenir de fuentes en tiempo real.

Estas son algunas diferencias entre otras cuantas.

¿QUÉ PAPEL DESEMPEÑA EL BUSINESS INTELLIGENCE EN UNA EMPRESA?

Cualquier persona dentro de una empresa en la cual su trabajo requiera de un mínimo de responsabilidad, conoce la ingente cantidad de datos con los que cuenta su compañía.

 
Por ello, si implantamos business intelligence en una empresa, podemos sacarle provecho de las siguientes formas:

· Facilita la recogida y la validación diaria de la información

· Posibilita el control y comunicación interdepartamental: Esto quiere decir que toda la información que es agregada a lo largo del día se hace visible y accesible para cualquier miembro de la empresa. 

· Facilita la toma de decisiones

· Mejora de calidad del dato: Al eliminar o reducir el tratamiento de la información no se depende del factor humano para la recogida de la información que se lleva a cabo a de manera automática.

· Estado de la empresa: Permite tomar decisiones en base al estado actual de la compañía.
· Realizar simulaciones: Para responder esas preguntas hipotéticas que a uno se le pueden presentar en una empresa, tales como ¿qué pasa si mi número de clientes aumenta o disminuye? o ¿y si mi mejor producto ya no tiene valor?

Por ello, muchas de la empresas de hoy en día utilizan Business Intelligence, así que si tienes una empresa, ya sabes lo que tienes que implantar en ella para que todo vaya mucho mejor.


Bibliografía:






-HERRAMIENTAS QUE UTILIZAN LAS 

EMPRESAS.

Business Intelligence, al ser un conjunto de estrategias, aplicaciones, datos, tecnologías enfocados a la administración y creación de conocimiento sobre el medio; es una herramienta muy útil para muchas empresas. Pero, ¿qué herramientas son las que utilizan estas empresas? ,¿qué ventajas puede aportar a estas?. Estas son unas de las cuestiones que trataremos a continuación.


Actualmente, gestionar una empresa es mucho más fácil si se cuenta con las herramientas adecuadas. Los avances en la tecnología se han convertido en la gran parte de estas herramientas, contribuyendo a una mejor gestión de una empresa. Estas herramientas ayudaran a ahorrar dinero, preocupaciones, y lo más importante de todo; tiempo. Así, la información estará controlada, habrá una mejor gestión y además se producirá un aumento de la productividad.
Y bien…¿cuáles son estas herramientas?.
En primer lugar, es necesario un gestor de tareas. Este ayudará a realizar la asignación de tareas a varios trabajadores, recordando lo que deben de hacer o que les gustaría hacer en un futuro. Además, se puede dividir en departamentos, personas, proyectos con el fin de tenerlo todo mejor organizado. Esta herramienta tiene un papel muy importante en un negocio ya que lleva el control de todo lo que sucede en un negocio, y lo que quieres que suceda. Existen diferentes aplicaciones para escoger como “Trello”, o “Redbooth”.


Otra herramienta puede ser un CRM (“Customer Relationship Management”). Un CMR es un programa que permite controlar las relaciones entre los clientes. Este programa está dotado de un registro de contactos, un seguimiento de interacción con ellos, una base de las interacciones con los clientes, etc.  Existen varios programas como “Salesforce”, “Base”, o “Netsuite” los cuales ayudarán a tener un buen control de clientes.


Por otro lado, es muy importante en cualquier empresa almacenar la información; ya sean archivos, datos, contratos, excels, o facturas en lugares seguros. Para ello, lo más fácil y seguro es el almacenamiento en la nube, el cual es utilizado por la gran mayoría de personas. Existen varios lugares de almacenamiento como Google Drive, Dropbox, Mega, etc.


Además, también es necesaria una administración de redes sociales. Actualmente, tanto las redes sociales como el correo electrónico son necesarios en todas las empresas; ya que son un medio para dar a conocer tu empresa, que te encuentren los clientes, para ver opiniones, etc. También existen gestores de redes sociales, los cuales pueden contribuir a organizar, planificar y realizar tus publicaciones, llevando así un mejor control de las redes sociales. Hay varios gestores de redes sociales como “Hootsuite” o “GremIn”.


Algo bastante útil es contar con un programa de facturación. Estos programas son capaces de automatizar las tareas administrativas, almacenar los gastos e ingresos y hacer balance con ellos, la asociación de cuentas bancarias, etc. Uno de los más completos se llama “Quipu” el cual revisa la información de la empresa y ayuda a analizar las cuentas para tomar mejores decisiones.



Bibliografía:



 

martes, 10 de diciembre de 2019

Recuperación de la información de los buscadores. Google.



Alejandro Villegas Sánchez.
Alvaro Serrano Íñigo.
Talía Lucero Azabache García.
Blog: ​https://ayudagestioninfo.blogspot.com/

INTRODUCCIÓN:

Actualmente Google es el buscador más usado y conocido a nivel mundial. Además de este existen muchos más tipos de buscadores en Internet, pero hoy nos centraremos en este. En uno de nuestros anteriores artículos; describimos más a fondo cómo funcionan estos buscadores. Sin embargo, hoy trataremos la recuperación de la información.

La información puede recuperarse a través de distintas herramientas como: bases de datos, Internet, mapas, ontologías. Además, saber hacer un buen uso de estas contribuye a recuperar una buena calidad de la información.



https://www.ecured.cu/images/5/5f/RI.jpg





 -Como se almacena la información. 

El lugar donde se almacena la información es esencial para la recuperación de esta. Imagínense que en un supuesto caso, Google tuviese que almacenar todos sus datos en discos duros, sería prácticamente imposible, ¿cierto? . Por ello, utilizan unas instalaciones llamadas centros de datos.

Un centro de datos, es un espacio de servidores en el que se gestiona, se almacena y se protege la información. Son usados generalmente por compañías encargadas de manejar y procesar grandes cantidades de datos desempeñando un papel importante en el ámbito de servicios electrónicos. Estas instalaciones son la base tecnológica para la realizar diferentes transacciones o distribuir contenido, siendo así fundamentales para los bancos o compañías de Internet​.



Uno de los mayores centros de datos se localiza en España, concretamente en Madrid. Este cuenta con 90.000 servidores, además de 60.000 circuitos interconectados y 48.000 km de cable, dando servicio a 250 clientes como; Ferrovial, Overon, AMC, etc.

En los centros de datos, los servidores se encuentran en grandes salas, encerrados en cajas, las cuales consiguen mantener los equipos a temperatura óptima. También, está presentes las salas de interconexión, en la que a través de cableado los operadores, con Telefónica como principal proveedor, se conectan con los clientes.







-Seguridad de los centros de datos. 


La seguridad en estas instalaciones es esencial debido a la gran cantidad de información que se almacena en ellas. Generalmente, el punto de entrada requiere una tarjeta de acceso, para vigilar la entrada y salida de personal y material. El acceso a las salas de los servidores es aún más restringido, y para entrar a ellas se emplea un lector de huellas dactilares. Además, todo está vigilado con cámaras de circuito cerrado.



https://www.hostname.cl/uploads/2017/06/seguridad-datacenter.jpg 

Google emplea una seguridad física bastante parecida en sus instalaciones. Sus instalaciones están totalmente valladas y vigiladas 24h al día. En el interior identifican a los usuarios que quieran entrar mediante análisis biométricos.
En cuanto a la protección de datos, es un apartado que Google se toma muy en serio. Los datos se guardan en diferentes localizaciones para garantizar su disponibilidad. Además de la seguridad física se utilizan algoritmos de encriptación, los datos no son guardados en texto, sino cifrados.
En 2013 Google tenía 13 centros de datos, en los que había aproximadamente 900.000 servidores. Estos fueron montados a medida por Google y funcionan bajo la distribución de Linux personalizada por Google.


 ​Bibliografía: 

https://www.elperiodico.com/es/tecnologia/20121017/donde-se-guardan-todos-los-datos-degoogle-2228160

https://www.elboletin.com/noticia/149793/tecnologia/en-el-corazon-de-internet:-como-funcio na-un-data-center.html

http://www.mariapinto.es/e-coms/busqueda-y-recuperacion-de-informacion/

https://es.wikipedia.org/wiki/Centros_de_datos_de_Google



TÉCNICAS DE RECUPERACIÓN Y ALMACENAMIENTO DE LA INFORMACIÓN. 

A todos nos ha pasado alguna vez como mínimo, si no más, de alguna foto, vídeo, archivo... que queramos volver a ver, reproducir o simplemente disfrutar de ello, y no hay manera de que aparezca.

Para ello, pues existen diversas formas o ​técnicas​ de búsqueda para estos elementos desaparecidos.


https://www.bigpubli.com/wp-content/uploads/2016/12/red-de-busqueda.jpg
  • Retroalimentación por relevancia​: Consiste en mantener mantener el mayor número de documentos estableciendo distintas estrategias de búsqueda. Lo que viene siendo en refinar la búsqueda del/los elementos, añadiendo así algún filtro en la búsqueda o algún parámetro adicional más específico.                                                                                                             De esta forma, añadiendo parámetros o filtros más específicos para la búsqueda, se dan dos ocasiones de almacenamiento y búsqueda: 
  • Silencio documental​: Son aquellos documentos almacenados en la base de datos pero que no han sido recuperados, debido a que la estrategia de búsqueda ha sido demasiada específica.      
  • Ruido documental​: Son aquellos documentos recuperados por el sistema pero que no son relevantes en la búsqueda. Este caso se suele dar cuando la estrategia de búsqueda es demasiado genérica.
  • Lógica difusa​:​ Consultar con frases sencillas, de forma que al realizar la búsqueda, elimina artículos, puntuación, palabras comunes, etc., dejando así solo las palabras relevantes. Estos dos métodos eran bastante simples además de que a cualquier usuario se le podría haber ocurrido intentar, por lo que pasamos a uno un pelín más complicado. 
  • Cluster​:​ Esta técnica es un modelo que identifica las frecuencias de los términos de búsqueda en la información recuperados. Se dan unos valores que actúan como agentes para organizar la información por orden de importancia, mediante algoritmos, por lo que la técnica del clustering también sirve para ordenar información. (Lo de los algoritmos lo vemos luego). Una muestra de cómo funciona la técnica del clustering:
 


  Esto empieza con la llamada ​hipótesis cluster,​ la cual dictamina qué documentos relacionados mediante esta técnica tienden a ser más relevantes para las mismas búsquedas.

En un fichero en el cual se han realizado estas técnicas, los documentos que pertenecen a un mismo cluster se almacenan en unos "localizadores adyacentes" y de esta manera un único acceso permite la recuperación de todos los documentos de un mismo cluster.
Por tanto en la recuperación de los parámetros de la búsqueda no se comparan con todos los documentos, sino que se comparan con el representante de cada una de las clases de la base de datos.

Sin embargo, como buena técnica, requiere obviamente de un buen algoritmo, de entre los cuales hablaremos del Algoritmo K-Means (K-medias en español).


https://www.caracteristicas.co/wp-content/uploads/2018/08/Algoritmo-sistemas-min-e1533652070357.jpg

El algoritmo k-means, es un método de agrupamiento, que tiene como objetivo, la separación de un conjunto de "​n ​ " observaciones en "​m ​ " grupos donde cada observación pertenece al grupo cuyo valor medio es más cercan.
El algoritmo estándar de este utiliza una técnica de refinamiento iterativo. También es conocido como el algoritmo de Lloyd, mayormente en la comunidad informática.
(Antes de nada, como vamos a ver, el concepto centroide se refiere a un punto el cual expresa el centro de una figura geométrica).

Con un conjunto de "​centroides ​ " el algoritmo realiza dos pasos:
  •  Paso de asignación​: Asigna a cada observación al grupo con la media más cercana.
 
https://wikimedia.org/api/rest_v1/media/math/render/svg/f7b15cf8861862c09bd76b86605d03a0f305313c
  • Paso de actualización​: Calcula los nuevos centroides como el centroide de las observaciones del grupo.
 

https://wikimedia.org/api/rest_v1/media/math/render/svg/cdd16cba1836f523f4f11d149ac3826598506c5e
 
Finalmente, el algoritmo se considera que ha acabado una vez las asignaciones de los centroides ya no cambian.
Claro, este algoritmo tiene unas específicas especificaciones valga la redundancia:
Se suele usar para grandes conjuntos de datos, por lo que ha sido ampliamente usado en áreas como segmentación de mercados, geoestadística o astronomía entre otros.
Como especificaciones más concretas, encontramos:

-Código fuente escrito en C++, Python with scipy
-Software de forma libre: Apache Mahout, ELKI, SciPy o CMU's GraphLab Clustering Library
-Algunas variaciones como Fuzzy C-Means Clustering, Algoritmo esperanza-maximización... 
 


Bibliografía: 

https://es.wikipedia.org/wiki/K-medias

http://www.mariapinto.es/e-coms/busqueda-y-recuperacion-de-informacion/ 

http://galeon.com/clustering/tecnicas.htm 

http://recuperaeinforma.blogspot.com/2011/09/tecnicas-de-recuperacion-de-informacion.html 





 LOS BUSCADORES 

 Los buscadores son herramientas que permiten facilitarnos el ubicar y recuperar información guardada en internet sobre un tema en concreto.  Poseen similitudes en su funcionamiento con las bases de datos. Guardan páginas con determinadas características (metadatos) y después, al usar palabras claves, muestra un listado con las más destacadas, relacionadas con el tema consultado. Entre ellas destacan: Google, Yahoo!, Bing, Alexa...  Sin embargo, se distinguen en que proporcionan información de carácter general, es decir, sin una gran profundización.



Podemos distinguir tres tipos de buscadores: los índices de búsqueda, los motores de búsqueda y los metabuscadores.

  • Los índices de búsqueda,​ fueron el primer tipo en crearse. El primero en originarse fue Yahoo.  Estos índices son originados por un grupo de personas que agrupan la información en temas con subcategorías.
https://image.slidesharecdn.com/catlogoenlnearevisado-090512204949-phpapp02/95/catlog o-en-lnea-revisado-44-728.jpg?cb=1242161410 

  • Los motores de búsqueda o buscadores,​ son los encargados de realizar la búsqueda de las webs a través de un programa llamado araña, creando una base de datos que relaciona la dirección de la página web con las 100 primeras palabras que aparece en esta. Podemos encontrar a: Google, Bing...  

https://www.muypymes.com/wp-content/uploads/2015/06/Bing3-630x330.jpg
  •  Los metabuscadores,​ son buscadores que, para ofrecernos una información, utilizan bases de datos de otros buscadores. Por ejemplo, Metracrawler, Zapmeta, Copernic...   




 GOOGLE   
Es una herramienta de búsqueda que nos permite tener al alcance una gran cantidad y variedad de información, páginas web, imágenes, vídeos...
Es uno de los motores de búsqueda más importante y utilizado en la actualidad.
Entre sus ventajas destacan: su formato simple y fácil de utilizar, la rapidez de su ejecución y su posesión de diversas herramientas beneficiosas a la hora de realizar las búsquedas.
Para buscar y seleccionar información a través de los buscadores, es el principal motivo por el cual se necesitan adquirir habilidades, conocimientos y una mayor destreza a la hora de aprender a darles uso.
Para acceder tenemos que ejecutar un explorador y escribir la URL: ​www.google.es​.



La página principal contiene diferentes campos:
  •  Vínculos superiores​: permiten selecciones diferente tipos de herramientas que nos ofrece.
  • Configuración de búsqueda: ​en el que podemos elegir preferencias, como por ejemplo, el idioma o número de páginas. 
  • Cuadro de búsqueda​: espacio en el que se coloca las palabras claves. 
  • Búsqueda avanzada: ​nos permite concretizar más en nuestras búsquedas. 
  • Herramientas de idioma. 
  • Barras de estadísticas:​ nos muestra la cantidad de resultados obtenidos y el tiempo que se ha tardado en realizar la búsqueda. 
  • Título de la página y el texto​, se trata de un breve resumen. 
  • Páginas similares:​ páginas similares obtenidas en la búsqueda. 


https://image.slidesharecdn.com/elementosdelapantalladegooglechrome-111108084522-phpapp02/95/elementos-de-la-pantalla-de-google-chrome-5-728.jpg?cb=1320741954

En Google se pueden realizar mediante búsquedas: simples y avanzada.
Búsqueda simple 
Se puede realizar mediante una palabra o varias palabras. Google nos muestra automáticamente
una lista de palabras que comienzan con esas letras.
Para reducir nuestra búsqueda solo tenemos que añadir más letras en nuestra búsqueda.
 ❖ Búsqueda avanzada 
Nos permiten limitar los resultados a obtener según nuestras preferencias. Por ejemplo:
resultados, número de páginas, idioma, fecha, región, presencia, dominio, derechos de uso,
safe search y formato de archivo.
Otras búsquedas: imágenes, videos, libros y google académico.


Bibliografía 

https://www.uv.es/avirtual/internet/t_4_1.htm http://ci2.ual.es/como-funcionan-buscadores-como-google-y-las-bases-de-datos/


http://recursostic.educacion.es/observatorio/web/es/internet/recursos-online/1004-busqueda s-avanzadas-en-google

https://computurismodm.wordpress.com/2016/09/17/los-buscadores/ 

https://www.aula21.net/tallerwq/buscadores/buscador1.htm