Se conoce informalmente como o internet invisible a una porción presumiblemente muy grande de la internet que es difícil de rastrear o ha sido hecha casi imposible de rastrear y deliberadamente, como lo es el caso del Proyecto Tor, el cual fue creado de esta manera por medio de métodos poco convencionales, como con la proxyficación con muchos proxys, el no utilizar direcciones de internet, sino códigos, y el pseudodominio de nivel superior. El cual fue creado por la Armada de los Estados Unidos como una prueba, aunque ahora es aprovechada por diversos grupos cibernéticos, tanto benevolentes como delincuentes, para proteger su privacidad.
Se conoce así a todo el contenido de internet que no forma parte de la internet superficial, es decir, de las páginas indexadas por las redes de los motores de búsqueda de la red. Esto se debe a las limitaciones que tienen las redes para acceder a todos los sitios web por distintos motivos. La mayor parte de la información encontrada en la internet profunda está enterrada en sitios generados dinámicamente y para los motores de búsqueda tradicionales es difícil hallarla. Fiscales y agencias gubernamentales han calificado a la internet profunda como un refugio para la delincuencia debido al contenido ilícito que se encuentra en ella.
Los recursos de la internet profunda pueden estar clasificados en las siguientes categorías:
- contenido de acceso limitado: los sitios que limitan el acceso a sus páginas de una manera técnica (Por ejemplo, utilizando captcha, que prohíben los motores de búsqueda de la navegación por y la creación de copias en caché.
- contenido dinámico: las páginas dinámicas que devuelven respuesta a una pregunta presentada o acceder a través de un formulario, especialmente si se utilizan elementos de entrada en el dominio abierto como campos de texto.
- contenido no enlazado: páginas que no están conectadas con otras páginas, que pueden impedir que los programas de rastreo web tengan acceso al contenido. Este material se conoce como páginas sin enlaces entrantes.
- contenido programado: páginas que solo son accesibles a través de enlaces producidos así como el contenido descargado de manera dinámica a partir de los servidores web a través de soluciones de Flash o Ajax.
- sin contenido HTML: contenido textual codificado en multitudinaria (imagen o vídeo) archivos o formatos de archivo específicos no tratados por los motores de búsqueda.
- web privada: los sitios que requieren de registro y de una contraseña para iniciar sesión
- web contextual: páginas con contenidos diferentes para diferentes contextos de acceso (por ejemplo, los rangos de direcciones IP de clientes o secuencia de navegación anterior).
Siempre que la persona no quiera ser asociada a determinado servicio, producto o contenido puede acudir a la deep web para publicarlo. Este es también el lugar donde mucha información tiene su origen, justo el año pasado se filtraron fotos privadas de los usuarios de la App Snapchat y así ha pasado también con documentos del gobierno y otras informaciones sensibles. Como la deep web es el paraíso de los hackers y otras personas de dudosa reputación es necesario que mantengas las medidas de protección para evitar que tu información privada sea robada.
