Estadísticas

cerrar ventana

El servidor web es un programa que funciona sobre una máquina en red, esperando conexiones del mundo exterior para servir ciertos documentos pedidos a través de un navegador.
Para comunicarse, el servidor y el navegador usan un metodo de comunicación asíncrona llamado HTTP (Protocolo de Hipertexto), que funciona de la forma siguiente:

  • El usuario arranca el navegador y escribe una dirección URL
  • El navegador se conecta a un servidor determinado y pide ese documento
  • El servidor de web maneja la petición y manda la respuesta si el documento existe, el servidor lo envia si no existe o su acceso no esta permitido, el servidor devuelve un documento con un mensaje de error
  • El documento enviado como respuesta a esta petición puede contener objetos embebidos. Estos pueden ser URL apuntando a otros recursos, documentos, imagenes, applets, cadenas de audio/ video, o cualquier otro objeto que se pueda direccionar por HTML

 

El navegador entonces pide todos aquellos objetos embebidos en la página del servidor, usando los métodos 2 y 3 anteriores, antes de mostrar el contenido de la página.


El método de comunicación se llama asíncrono, porque el navegador envia las diferentes peticiones a la vez (sin tener que esperar a haber recibido uno tras otro), utilizando diferentes canales de comunicación.

Desde que las peticiones del navegador son amenudo manejadas por diferentes procesos o hilos del servidor , no existe ninguna relación entre las entradas en el fichero de informe causado por las respuestas del servidor a las peticiones del documento y sus objetos embebidos.

Por ejemplo, la orden por la que el servidor marca una transmision exitosa del documento y sus imágenes contenidas en él no son predecibles y dependen del tipo de documento, objetos, velocidad del servidor, carga del sistema y de red y otros muchos parámetros.

Todos y cada una de las respuestas del servidor , ya sea exito, error o un tiempo de espera agotado (ej. no hay respuesta) - se marca en el fichero de informe del servidor. Desde que el servidor ha recibido una petición, su respuesta correspondiente se le llama un HIT (un Acceso). El número de Hits debe ser igual al número de líneas del informe menos las líneas vacías o corruptas. Una entrada típica en el formato habitual de informe es:

hostname-[01/Feb/1998:10:10:00 +0100]"
GET/index.aspx HTTP/1.0"200 4839

El campo hostname contiene el nombre completo del dominio cualificado (FQDN) del sitio accediendo a tu servidor (Mirar "Casos especiales", mas abajo). Los dos campos siguientes contiene normalmente un menos "-" para indicar que esos campos están vacíos. La fecha esta entre corchetes ("[" y "]"), ye l siguiente campo contiene el método de peticion ("GET", for ejemplo) el nombre del documento requerido (URL) y la especificación de protocolo ("HTTP/1.0)

El campo siguiente contiene el código de respuesta del servidor("200" es "Correcto" , "404" es "Documento no encontrado", por ejemplo).El último campo contiene el tamaño del documento (algunos servidores marcan el número de bytes transferidos hasta ahora y otros el tamaño total, que difieren en que si el usuario interrumpe la transferencia antes de haber sido completamente transferido.

Hay un par mas de formatos de fichero de informe, el formato combinado o el extendido de registro. Esos formaros añaden el nombre del navegador y la URL referida (la página que contiene el link al documento pedido, si esta peticion se ha realizado a partir de un link) en el registro del fichero de informe. Estos dos formatos (Combinado o Extendido) se añaden en los siguientes dos campos al formato de informe común (CLF) de las dos más comunes formas siguientes:

CLFMozilla/2.0 (X11; IRIX 6.3; IP22)
http://foo/bar.htmlCLF"http://foo/bar.html"
"Mozilla/2.0 (X11; IRIX 6.3; IP22)"

Dese cuenta que en la segunda forma, el User-Agent (navegador) y la URL de referencia estan entre comillas, con lo que se hace ambiguo en ciertos casos como URL de referencia erróneos, que tambien pueden llevar comillas, por lo que se prefiere el primer método

Las entradas de registro mostradas es solo la información que el servidor guarda en el fichero de informe. Debería haber mucha más información que se transfiere entre el servidor y el cliente, pero aunque es disponible a través de Scripts CGI corriendo en su servidor, no se registran en el fichero de informe. Es más, HTTP-Analyze sólo puede mostrar la información en sumario del fichero de informe (logfile) - ni más ni menos.


--------------------------------------------------------------------------------

Recogerlos en el navegador

Tan pronto como una página ha llegado al cache de disco del navegador, el navegador puede enviar peticiones condicionadas de los documentos o de los objetos embebidos. Esta petición condicionada pregunta al servidor sobre los documentos/objetos que han sido modificados desde la última vez que se pidió la página (y si la página está todavía en la cache del navegador). Así, el tráfico de red se reduce un poco, pues los ficheros solo se transfieren si han sido cambiados recientemente. Si esa peticion condicional llega, el servidor responderá un codigo 304 (Sin modificar), indicando que el documento no ha sido cambiado desde el código 200 (Exito) en el intervalo de tiempo especificado. Desde que el navegador esta normalmente configurado (por defecto) para realizar las peticiones una vez por sesión y si no realiza búsqueda en la caché, ni siquiera puedes llegar a ver un código 304 si los usuarios visitan tu web en esa misma sesion. Las peticiones condicionales solo se realizan si el usuario termina esa sesión con el navegador y más tarde reinicia el navegador

Recogerlos en un Servidor Proxy

Organizaciones con un gran número de usuarios - como compañias, universidades o proveedores en linea - a menudo usan un servidor asi llamado proxy ( próximo), por dos razones principales:

Ambas formas de almacenaje (cache) hacen técnicamente imposible contar los visitantes o seguir su pista a través de su sitio web. Como ve, en el registro de su servidor, es unos cuantos accesos en un principio, y algún codigo 304, por petición condicional de algun navegador, dependiendo de las preferencias del navegador o del proxy.

 

El informe de estadísticas contiene entre otras la siguiente información


La siguiente tabla supone un sumario de todos los términos en las estadísticas que no se disciernen por si mismas.

Término Significado

Hits

Un HIT, o acceso, es una respuesta dada por un servidor que ha sido pedida desde un navegador. Esto incluye cualquier respuesta dede el servidor, no solo documentos o ficheros de texto. Si una página tiene objetos embebidos, el servidor generara por ejemplo 3 acesos, 1 por el documento y 2 por un par de imagenes que tuviera.
Files Si el usuario pide un documento y el servidor le devuelve un fichero por respuesta, se cuenta como un código 200 (OK). Cualquier respuesta así se cuenta como un fichero. "Fichero" aqui significa cualquier tipo de fichero
Code 304 Una respuesta Code 304 (No modificado) se genera por el servidor si un documento no ha sido modificado desde la última vez que fue requerido por el usuario, por lo que no hay necesidad de responderlo si ya ha sido almacenado en la cache de disco del navegador cliente, por lo que puede construie el documento a partir de ese recurso de la cache de forma local. Esta técnica reduce el tráfico de red, aunque tambien cause inexactitudes en los informes registrados de las páginas, dado que el navegador solo realiza estas peticiones una vez por sesión, y en el caso de los proxies solo se realizan una vez independientemente de los usuarios. Aún así la relación entre ficheros y cód.304 refleja la eficiencia de los mecanismos de cache por lo menos de aquellos accesos que se han producido en el servidor.
Pageviews Son todos aquellos ficheros que tienen un sufijo de formato texto (.html, .text) o aquellos que son el directorio índice de ficheros. Este número permite estimar cuantos documentos "reales" transmite su servidor. Si están definidos correctamente, el analizador puntúa estos ficheros de texto (documentos) como pageviews. No incluyen imagenes, CGI, Java Applets u otro objetos que no terminen con una extensión marcada como pageviews (.html, .text)
Other responses
¹
Hay muchas mas respuestas que los cod.200 o cod.304, especialmente en la especificación del protocolo estandard HTTP/1.1 que viene. Pueden ser cod.302 (redirigida), cod.401 (página movida), o cod.404 (O no existe en este servidor, o su acesso esta restringido)
KBytes transferred La cantidad de datos transferidos durante periodo de sumario total del cual el servidor genera el informe. Algunos servidores registran solo los datos transferidos y otros el tamaño completo del fichero. Difieren en que si el navegador cliente ha sido interrumpido de la descarga, algunos servidores (como los de Netscape) solo registran los datos enviados y no los datos que hubieran sido transferidos si la página hubiera sido completamente descargada.
KBytes requested
¹
Esta es la cantidad de datos pedidos durante el tiempo total evaluado.HTTP-Analyze calcula este número sumando los valores de KBytes transferred y KBytes saved by cache (ver abajo )
KBytes saved by cache
¹
La cantidad de datos salvados por los diversos mecanismos de cache como navegadores y servidores proxy. Es el número de cod.304 de un fichero multiplicado por el tamaño de estos ficheros. Dado que HTTP-Analyze solo sabe el tamaño del archivo si ha sido pedido, en el mismo periodo de tiempo, por lo que los valores KBytes saved by cache y KBytes requested son solo orientativos del valor real
Unique URLs Unique URLs el número de URL válidas y diferentes accediendo al servidor durante un tiempo determinado. Esto te muesta el número de ficheros diferentes pedidos al menos una vez en el correspondiente período de tiempo.
Unique sites El número de servidores diferentes accediendo al servidor durante un tiempo determinado. Este gráfico de tiempo y acceso está ligado al mes actual. Esto significa que si un servidor accede al tuyo muy a menudi, solo se cuenta una vez por mes, solo la suma de los servidores únicos, por mes se lista en el informe de estadístcas
Sessions Similar a unique sites,esto es el número de servidores únicos accediendo a un servidor en un espacio de tiempo. Este se realiza una vez al dia por defecto con fines de compatibilidad con sistemas antiguos, pero se puede cambiar con la opción -u o por fichero configuración de directivas de sesion. Por ejemplo, si el espacio de tiempo es de 2 horas tras el primer acceso desde ese servidor, son tomadas como una misma sesión. Todos los siguientes accesos a partir de esas 2 horas serán otra sesión. Esto es una forma de saber un número aproximado de cuantas sesiones acceden a tu servidor desde diferentes servidores.

¹ sólo muestra el total de la sumatoria de las paginas

cerrar ventana