1 00:00:00,000 --> 00:00:09,647 2 00:00:09,647 --> 00:00:11,730 ALTAVOZ: Ahora vamos a bucear en el código de distribución 3 00:00:11,730 --> 00:00:14,470 y echar un vistazo en el contexto en el que el código que escribir 4 00:00:14,470 --> 00:00:15,780 que se va a operar. 5 00:00:15,780 --> 00:00:17,350 Al final del día, usted va a poner en práctica 6 00:00:17,350 --> 00:00:18,710 la totalidad del servidor web. 7 00:00:18,710 --> 00:00:20,460 Pero hemos proporcionado que con el esqueleto 8 00:00:20,460 --> 00:00:24,090 código que tiene algunas funciones, particularmente en relación con la creación de redes. 9 00:00:24,090 --> 00:00:25,390 Vamos a echar un vistazo. 10 00:00:25,390 --> 00:00:27,560 >> Así que aquí hacia la parte superior del fichero es un manojo 11 00:00:27,560 --> 00:00:30,020 de la función de probar los requisitos de macro. 12 00:00:30,020 --> 00:00:33,570 Ahora bien, esto es sólo una característica de c, según el cual de acuerdo con un montón de páginas de manual 13 00:00:33,570 --> 00:00:36,410 usted tiene que definir algunas de estas constantes para ser verdad 14 00:00:36,410 --> 00:00:39,920 o ser incluso números específicos de manera que usted tiene acceso a ciertas funciones. 15 00:00:39,920 --> 00:00:42,470 De lo contrario van a ser no declarada y usted no tendrá acceso. 16 00:00:42,470 --> 00:00:45,340 Así que he hecho esto por medio de la lectura de las páginas de manual. 17 00:00:45,340 --> 00:00:48,410 Ahora abajo, en las líneas 15 y 17, que 18 00:00:48,410 --> 00:00:50,550 tienen un montón de límites declarados. 19 00:00:50,550 --> 00:00:53,370 >> Y hemos prestado estos de una servidor web popular llamado Apache. 20 00:00:53,370 --> 00:00:54,650 Y estos son sólo números que se va 21 00:00:54,650 --> 00:00:56,810 para limitar el número total de bytes que se permite 22 00:00:56,810 --> 00:01:01,930 en los diversos contextos de la petición HTTP que se permite a un navegador de enviarme. 23 00:01:01,930 --> 00:01:04,310 A continuación, definimos octetos. 24 00:01:04,310 --> 00:01:07,790 Ahora un octeto es sólo una forma elegante de decir un byte, u ocho bits. 25 00:01:07,790 --> 00:01:10,720 Resulta que en antaño un byte no era necesariamente ocho bits 26 00:01:10,720 --> 00:01:12,339 de modo octeto es siempre ocho bits. 27 00:01:12,339 --> 00:01:14,880 Así que en este caso hemos adoptado lo que es común en la red 28 00:01:14,880 --> 00:01:17,410 mundo de llamar a ocho bytes de un octeto. 29 00:01:17,410 --> 00:01:21,840 >> Aquí he especificado que octetos voluntad ser de 512, por lo que al igual que en el análisis forense 30 00:01:21,840 --> 00:01:24,170 cuando leemos un montón de bytes a la vez, también en este caso, 31 00:01:24,170 --> 00:01:27,390 vamos a leer un manojo de octetos a la vez. 32 00:01:27,390 --> 00:01:28,922 Siguiente un montón de archivos de cabecera. 33 00:01:28,922 --> 00:01:30,255 ¿Cómo sé que incluya estos? 34 00:01:30,255 --> 00:01:32,730 Bueno, yo simplemente leí el hombre páginas para un número de funciones 35 00:01:32,730 --> 00:01:35,620 que vamos a utilizar en esta distribución código e incluir en los 36 00:01:35,620 --> 00:01:37,390 Me dio instrucciones para. 37 00:01:37,390 --> 00:01:39,090 >> Y ahora tenemos un tipo de datos. 38 00:01:39,090 --> 00:01:41,470 Hemos declarado un octeto para ser un char. 39 00:01:41,470 --> 00:01:44,040 Y veremos más adelante que eso es utilizado en todo el código. 40 00:01:44,040 --> 00:01:45,670 Y hemos declarado una manojo entero de prototipos, 41 00:01:45,670 --> 00:01:47,961 y vamos a caminar rápidamente por cada una de esas funciones. 42 00:01:47,961 --> 00:01:50,400 Por último, y quizás lo más importante tener en 43 00:01:50,400 --> 00:01:52,520 la mente en este momento de la historia, es que no 44 00:01:52,520 --> 00:01:54,520 son, de hecho su conjunto montón de variables globales 45 00:01:54,520 --> 00:02:00,430 en la parte superior del archivo, raíz, CFD, SFD, solicitud, archivo y el cuerpo. 46 00:02:00,430 --> 00:02:03,960 >> Ahora generalmente, utilizando tantos mundial variables o variables globales en absoluto, 47 00:02:03,960 --> 00:02:05,280 no es la práctica de nuevo. 48 00:02:05,280 --> 00:02:09,090 Pero resulta que también estamos utilizando un técnica llamada manejo de señales más tarde 49 00:02:09,090 --> 00:02:11,930 en el código, lo que nos permite detectar cuando el usuario pulsa algo 50 00:02:11,930 --> 00:02:15,080 como CTRL C y se cerrará el servidor con gracia. 51 00:02:15,080 --> 00:02:18,240 Y con el fin de hacer eso con gracia y en realidad liberar memoria, 52 00:02:18,240 --> 00:02:20,800 necesitamos tener acceso a estas variables globales. 53 00:02:20,800 --> 00:02:24,510 >> Y ahora vamos a echar un vistazo a principal, que impulsa la totalidad de este programa. 54 00:02:24,510 --> 00:02:27,720 En primer lugar, en la parte superior aquí tener una variable de número de error 55 00:02:27,720 --> 00:02:29,570 que parece no tener un tipo, pero eso es 56 00:02:29,570 --> 00:02:31,500 porque en realidad definido en un archivo llamado 57 00:02:31,500 --> 00:02:34,800 errno.h error que se incluye más arriba. 58 00:02:34,800 --> 00:02:38,780 Si lo hace el hombre errno a realidad véase la definición de esta cosa, 59 00:02:38,780 --> 00:02:41,230 verás que se trata de un variable global especial que 60 00:02:41,230 --> 00:02:43,350 es fijado por un manojo entero de funciones no escrita 61 00:02:43,350 --> 00:02:48,730 por nosotros, sino por los autores de Linux y otros sistemas para establecer realmente 62 00:02:48,730 --> 00:02:52,400 un número a esa variable cuando algo va mal, para que pueda a nivel mundial 63 00:02:52,400 --> 00:02:54,830 averiguar lo que salió mal. 64 00:02:54,830 --> 00:02:58,540 >> Ahora abajo verás una nueva técnica tal vez usando getopt, 65 00:02:58,540 --> 00:03:01,790 una función que ayuda comando de análisis sintáctico argumentos de la línea para que no nos hacemos 66 00:03:01,790 --> 00:03:05,540 tiene que preocuparse de perder el tiempo pensando la manera de analizar algo así como 8080, 67 00:03:05,540 --> 00:03:08,350 o un guión p, o un guión h para obtener ayuda. 68 00:03:08,350 --> 00:03:10,300 getopt básicamente hace que para nosotros. 69 00:03:10,300 --> 00:03:11,750 Consulte la página de manual para más. 70 00:03:11,750 --> 00:03:13,960 >> A continuación, hacemos un poco de error comprobación para asegurarse de 71 00:03:13,960 --> 00:03:17,420 que el número de puerto está dentro del rango especificado en la especificación. 72 00:03:17,420 --> 00:03:20,240 A continuación, vemos una llamada a la función iniciar, cuya definición nos va 73 00:03:20,240 --> 00:03:24,040 mira en un momento, y como su nombre sugiere, este inicia el servidor web. 74 00:03:24,040 --> 00:03:26,960 Aquí tenemos una llamada a una función llama señal que dice: 75 00:03:26,960 --> 00:03:30,750 siempre y cuando escuche Control C de teclado del usuario, siga adelante y llame 76 00:03:30,750 --> 00:03:34,650 un controlador de función llamada que está pasando lo que en última instancia, limpias y dejar de 77 00:03:34,650 --> 00:03:35,500 el servidor. 78 00:03:35,500 --> 00:03:39,470 >> Debajo de eso es lo que parece ser un bucle infinito, la primera línea de los cuales 79 00:03:39,470 --> 00:03:41,660 efectivamente es una llamada a una función llamada 80 00:03:41,660 --> 00:03:45,110 restablecer, que nosotros mismos aplicar más adelante con el fin 81 00:03:45,110 --> 00:03:47,470 para liberar a algunos de nuestros estados globales. 82 00:03:47,470 --> 00:03:50,480 Después de que es una línea de código que condicionalmente 83 00:03:50,480 --> 00:03:52,576 está comprobando el retorno valor de conectado. 84 00:03:52,576 --> 00:03:55,700 Miradas Ahora conectados como un predicado, algo que devuelve verdadero o falso. 85 00:03:55,700 --> 00:03:58,040 Y lo hace, pero hay algo especial en conectado 86 00:03:58,040 --> 00:03:59,960 en que se trata de una llamada de bloqueo. 87 00:03:59,960 --> 00:04:03,180 Será sentarse allí y esperar hasta que el navegador del usuario 88 00:04:03,180 --> 00:04:05,860 intenta conectarse a esta web servidor y sólo entonces será 89 00:04:05,860 --> 00:04:10,160 return true o false para que procedamos en el interior de esta sentencia if. 90 00:04:10,160 --> 00:04:13,870 >> Una vez allí, observe esta función a un función llamada de análisis, lo que escribimos, 91 00:04:13,870 --> 00:04:17,230 que analiza todos los octetos, todo de los bytes procedentes de un navegador 92 00:04:17,230 --> 00:04:21,010 para el servidor, por lo que podemos entregar de vuelta en última instancia, un valor a uno 93 00:04:21,010 --> 00:04:24,420 de esas variables globales que almacena todos los bytes en sólo 94 00:04:24,420 --> 00:04:26,630 las cabeceras de ese solicitud, no el cuerpo 95 00:04:26,630 --> 00:04:28,920 si no eran en realidad un cuerpo a la misma. 96 00:04:28,920 --> 00:04:32,980 >> Ahora abajo comenzamos a analizar los encabezados para extraer 97 00:04:32,980 --> 00:04:35,490 un subconjunto de la información que nos preocupamos. 98 00:04:35,490 --> 00:04:37,740 Específicamente, por la especificación, nosotros primero 99 00:04:37,740 --> 00:04:40,580 quería pedir línea, que es sólo que muy primera línea que 100 00:04:40,580 --> 00:04:45,710 esperemos que dice algo así como get reducir o algún camino y luego HTTP 1.1. 101 00:04:45,710 --> 00:04:48,150 Estamos utilizando esta metáfora de una aguja en un pajar 102 00:04:48,150 --> 00:04:50,370 buscar en particular caracteres o direcciones. 103 00:04:50,370 --> 00:04:53,120 Y de hecho, hay un número de funciones en nuestro código de distribución 104 00:04:53,120 --> 00:04:56,930 que usted, también, puede ser que encuentre útil en la búsqueda de valores particulares. 105 00:04:56,930 --> 00:05:00,630 >> En última instancia, copiamos estos bytes en una línea de variable llamada, 106 00:05:00,630 --> 00:05:03,510 que notamos, también, tenemos asignado en la pila 107 00:05:03,510 --> 00:05:05,890 por medio de una matriz de tamaño dinámico. 108 00:05:05,890 --> 00:05:08,350 Y estamos tratando deliberadamente para evitar llamar a malloc 109 00:05:08,350 --> 00:05:11,100 porque, de nuevo, porque de Control C siendo 110 00:05:11,100 --> 00:05:14,630 una posible opción de este programa, no quiero tener este código de repente 111 00:05:14,630 --> 00:05:17,479 interrumpido por los golpes de usuario Control C, el resultado de los cuales 112 00:05:17,479 --> 00:05:20,270 es que yo no podría tener una oportunidad para algo gratis que he malloced. 113 00:05:20,270 --> 00:05:23,660 Así que estoy tratando de usar tanto de la pila es lo que pueda aquí. 114 00:05:23,660 --> 00:05:26,040 >> El siguiente, un montón de a dos. 115 00:05:26,040 --> 00:05:28,930 La especificación expondrá exactamente lo que se espera aquí, 116 00:05:28,930 --> 00:05:31,800 pero los comentarios que dan una pista de lo que está por venir. 117 00:05:31,800 --> 00:05:33,830 Primero tiene que validar la línea de petición 118 00:05:33,830 --> 00:05:37,760 y asegúrese de que parece que el especificaciones gramática, por así decirlo, 119 00:05:37,760 --> 00:05:38,541 dice que debería. 120 00:05:38,541 --> 00:05:41,290 A continuación, deberá extraer algo llamado la consulta, la materia hacia fuera 121 00:05:41,290 --> 00:05:44,200 después de un signo de interrogación, como vimos con nuestro ejemplo Google 122 00:05:44,200 --> 00:05:46,320 de pasada en un parámetro HD. 123 00:05:46,320 --> 00:05:49,050 Luego se concatena juntos la raíz del servidor web 124 00:05:49,050 --> 00:05:52,520 con la ruta que está en esa primera línea de petición 125 00:05:52,520 --> 00:05:56,010 y formar la ruta completa el archivo que queremos buscar. 126 00:05:56,010 --> 00:06:00,300 >> Después de eso, vamos a asegurarnos que el archivo existe y es legible. 127 00:06:00,300 --> 00:06:05,100 Y luego vamos a extraer su extensión de archivo, los archivos .html o .php la, 128 00:06:05,100 --> 00:06:09,920 o alguna extensión que está en el final de la cadena solicitada. 129 00:06:09,920 --> 00:06:11,940 El siguiente es un todo montón de código que escribimos 130 00:06:11,940 --> 00:06:15,800 para generar realmente PHP contenido para usted generado. 131 00:06:15,800 --> 00:06:18,010 En pocas palabras, esta código toma en el nombre 132 00:06:18,010 --> 00:06:20,250 del archivo que desea PHP interpretar. 133 00:06:20,250 --> 00:06:24,630 Nosotros pasamos por algo llamado un tubo en el intérprete de PHP. 134 00:06:24,630 --> 00:06:28,060 Vuelve la respuesta como si la respuesta fuera un archivo en sí mismo. 135 00:06:28,060 --> 00:06:32,110 Y luego iteramos sobre ese archivo de bytes, tirando todos en un búfer 136 00:06:32,110 --> 00:06:34,180 por lo que podemos en última instancia imprimirlos. 137 00:06:34,180 --> 00:06:37,230 >> De hecho, todos estos pide aquí para dprintf 138 00:06:37,230 --> 00:06:40,110 nos permite imprimir algo llamado un descriptor de archivo, que 139 00:06:40,110 --> 00:06:42,350 es simplemente un entero que representa un archivo. 140 00:06:42,350 --> 00:06:45,360 Muy similar en espíritu, pero fundamentalmente diferente de un archivo 141 00:06:45,360 --> 00:06:46,620 indicador de la estrella. 142 00:06:46,620 --> 00:06:50,260 Observe cómo se puede utilizar la sintaxis como printf aquí para que yo pueda dinámicamente 143 00:06:50,260 --> 00:06:54,000 insertar algo así como la longitud por el valor de una cabecera HTTP 144 00:06:54,000 --> 00:06:55,270 llamado Content-Length. 145 00:06:55,270 --> 00:06:57,990 Y en última instancia, he utilizado la función derecho a escribir en realidad 146 00:06:57,990 --> 00:07:00,040 el cuerpo de la solicitud. 147 00:07:00,040 --> 00:07:03,750 >> Por desgracia, sólo implementamos soporte para dinámicamente 148 00:07:03,750 --> 00:07:05,350 archivos PHP generados. 149 00:07:05,350 --> 00:07:08,520 No nos implementamos apoyo a archivos estáticos como gifs y archivos JPEG, 150 00:07:08,520 --> 00:07:10,660 y archivos CSS y HTML. 151 00:07:10,660 --> 00:07:14,450 Eso, por desgracia, se deja a usted para responder a la finalidad cliente 152 00:07:14,450 --> 00:07:15,090 esto que ver. 153 00:07:15,090 --> 00:07:20,050 Así que allí usted encontrará que hay no mucho inspiración dentro de ese bloque, 154 00:07:20,050 --> 00:07:23,520 pero si un poco más arriba de lo nos fuimos sobre la interpretación de código PHP, 155 00:07:23,520 --> 00:07:25,520 las funciones que se van a usar son un poco diferentes. 156 00:07:25,520 --> 00:07:27,561 >> De hecho, usted puede pedir prestado parte de la funcionalidad 157 00:07:27,561 --> 00:07:29,620 tal vez de la medicina forense conjunto de problemas, porque 158 00:07:29,620 --> 00:07:32,860 al final del día todo lo que necesita hacer aquí es una vez que sabes lo que abrir el archivo 159 00:07:32,860 --> 00:07:35,690 y una vez que usted sabe que el llamado Tipo MIME o tipo de contenido, 160 00:07:35,690 --> 00:07:39,040 usted necesita leer en esos bytes y de alguna manera ellos escupir de vuelta. 161 00:07:39,040 --> 00:07:41,190 >> Y ahora un recorrido por este otras funciones de archivo. 162 00:07:41,190 --> 00:07:43,820 Hasta se conecta primero, que simplemente devuelve true 163 00:07:43,820 --> 00:07:47,350 cuando por fin se oye un la conexión de un usuario. 164 00:07:47,350 --> 00:07:48,786 El siguiente es el error. 165 00:07:48,786 --> 00:07:52,296 Error, por su parte, como una función que escribió para manejar todas las diferentes 400 166 00:07:52,296 --> 00:07:55,360 y el estado HTTP 500 códigos que usted puede ser que desee 167 00:07:55,360 --> 00:07:58,500 para enviar de nuevo al usuario, junto con un mensaje estándar. 168 00:07:58,500 --> 00:08:01,950 >> El siguiente paso es la carga, un particular función carnoso, cuyo propósito en la vida 169 00:08:01,950 --> 00:08:06,920 está a leer de una estrella archivo puntero del contenido de un archivo en una memoria intermedia mundial 170 00:08:06,920 --> 00:08:09,000 que declaramos a nivel mundial por encima de [? principal. ?] 171 00:08:09,000 --> 00:08:12,649 Esto es un poco compleja porque hay que leer los bytes del archivo 172 00:08:12,649 --> 00:08:14,690 pero comprobar en cada iteración si ya hemos 173 00:08:14,690 --> 00:08:17,600 golpear el final del archivo o algo ha ido mal. 174 00:08:17,600 --> 00:08:21,210 Y utilizamos realloc para asegurarse de que cualquier búfer que estamos usando es cada vez mayor 175 00:08:21,210 --> 00:08:24,440 y creciendo y creciendo y siempre mantenerse a la vanguardia de la cantidad de bytes 176 00:08:24,440 --> 00:08:25,675 que tenemos que encajar allí. 177 00:08:25,675 --> 00:08:27,550 Handler, por su parte, es la función que recibe 178 00:08:27,550 --> 00:08:30,630 llamado por manera de tener Control C registrada como una señal de 179 00:08:30,630 --> 00:08:32,140 que queremos interceptar. 180 00:08:32,140 --> 00:08:34,070 Nótese aquí en handler que en última instancia 181 00:08:34,070 --> 00:08:36,780 llamadas detienen, que por supuesto detiene el servidor web. 182 00:08:36,780 --> 00:08:39,750 Y, por desgracia, de búsqueda no se ha implementado. 183 00:08:39,750 --> 00:08:41,940 En espíritu, este es un función bastante simple. 184 00:08:41,940 --> 00:08:44,900 Dada la extensión de archivo, necesita para volver está el llamado MIME 185 00:08:44,900 --> 00:08:46,320 tipo o tipo de contenido. 186 00:08:46,320 --> 00:08:49,260 Y se especifica en el pliego de condiciones lo que la cartografía debe ser. 187 00:08:49,260 --> 00:08:52,330 Pero hay que traducir que en última instancia al código c. 188 00:08:52,330 --> 00:08:56,490 >> El siguiente es nuestra función similar a carne denominado parse, cuyo propósito en la vida 189 00:08:56,490 --> 00:08:59,350 es leer, no desde un archivo, pero a partir de una conexión de red. 190 00:08:59,350 --> 00:09:03,510 En concreto, la lectura y análisis de la Petición HTTP que ha llegado desde un navegador 191 00:09:03,510 --> 00:09:05,940 al servidor para que en última instancia, podemos analizar 192 00:09:05,940 --> 00:09:09,530 a tan sólo los encabezados de la solicitud línea y volver a aquellos que 193 00:09:09,530 --> 00:09:12,720 por medio de un tampón global que declaramos anteriormente [? principal. ?] 194 00:09:12,720 --> 00:09:14,880 >> Cambiar, por su parte, es un función que definimos 195 00:09:14,880 --> 00:09:18,730 que es llamada de forma iterativa el interior de principal cada vez que estás a punto 196 00:09:18,730 --> 00:09:20,799 listo para empezar a escuchar para una nueva conexión 197 00:09:20,799 --> 00:09:22,840 de manera que siempre sabemos el estado de nuestras variables 198 00:09:22,840 --> 00:09:24,870 y por lo que hemos también liberado cualquier memoria que 199 00:09:24,870 --> 00:09:28,070 podría haber sido asignado para una conexión de red anterior. 200 00:09:28,070 --> 00:09:30,060 El siguiente paso es empezar, la función que escribimos 201 00:09:30,060 --> 00:09:31,920 que contiene un conjunto gran cantidad de código de red 202 00:09:31,920 --> 00:09:34,420 que en última instancia se inicia el servidor web. 203 00:09:34,420 --> 00:09:36,680 >> Dura hasta es la función llamado parada, que 204 00:09:36,680 --> 00:09:38,770 hace exactamente eso, detiene el servidor web. 205 00:09:38,770 --> 00:09:42,270 Pero primero que libera cualquier memoria que aún se ha asignado. 206 00:09:42,270 --> 00:09:45,850 Pero llama en última instancia de salida sin ni siquiera devolver el control 207 00:09:45,850 --> 00:09:47,480 a nuestra función principal. 208 00:09:47,480 --> 00:09:49,480 En última instancia, una de las la mayoría de las técnicas importantes 209 00:09:49,480 --> 00:09:52,680 en la aplicación de este servidor web es va a ser un poco de ensayo y error, 210 00:09:52,680 --> 00:09:55,886 tener un navegador ventana abierta a la derecha y una ventana de terminal en 211 00:09:55,886 --> 00:09:57,760 izquierda, la consola de servidores ventana, de modo que usted 212 00:09:57,760 --> 00:10:00,420 puede ver los mensajes que se encuentran que se muestra en la pantalla. 213 00:10:00,420 --> 00:10:04,170 >> Pero mejor aún sería tercera ventana, una segunda ventana de terminal, 214 00:10:04,170 --> 00:10:07,135 en el que se utiliza Telnet, el uso para los que se prescribe en la especificación. 215 00:10:07,135 --> 00:10:09,640 Y Telnet es sólo una muy programa de red simple 216 00:10:09,640 --> 00:10:12,660 que le permite a finges ser un navegador en una ventana 217 00:10:12,660 --> 00:10:14,540 mientras habla con la otra ventana. 218 00:10:14,540 --> 00:10:16,830 De esta manera usted puede ver exactamente los comandos textuales 219 00:10:16,830 --> 00:10:18,700 que están regresando del servidor al cliente 220 00:10:18,700 --> 00:10:20,810 sin tener que meter alrededor de desarrollador de Chrome 221 00:10:20,810 --> 00:10:24,010 herramientas en una por lo demás interfaz clunkier. 222 00:10:24,010 --> 00:10:29,099