Un pequeño tour a la instalaciones TI de CTIO

La semana pasada fue una semana poco movida aquí en CTIO. Los Ploneros, provenientes de Viña del Mar, luchaban contra las fuerzas del sueño para encontrar algún trabajo y sentirse útiles. Sin embargo, en una de las conversaciones culturales y tecnológicas apareció el tema de la Fibra Óptica.

Tras la larga conversación,  uno de nuestros compañeros del departamento de informatica y seguridad (CISS), nos invitó a recorrer las instalaciones TI de la empresa. En una primera instancia nos describió los procedimientos de se maneja la fibra óptica, desde cuales son los proovedores y como se construía una de estas y los multiples procesos hasta llegar a ser un medio físico tan poderoso.

Uno de estos procesos es la de preparar la fibra y colocarle los conectores correspondiente al tipo de éstas. Para esto necesita en total 3 maletas con diferentes herramientas: crimpeadoras, pegamentos, cortadoras, lijas, etc.

¿Se pueden imaginar que existen instrumentos para ver un pelo de fibra microscopicamente para verificar que no tenga impurezas en su nucleo?

Luego de finalizar el tour por la capa física, fuimos a recorrer las salas de computadores donde están alojados todos los equipos de redes tales como: switches, routers, centrales telefónicas y los del tipo almacenamiento que son servidores. Aparte de la seguridad para poder entrar a dicha sala, me sorprendió todos los equipos que manejan la fibra óptica y lo grueso que pueden llegar a ser los cables, la cantidad de cables cat5 en los switches y routers Cisco era realmente sorprendete (sólo hay que ver las fotos para saber que alguien tuvo que darse la lata de ordenar todo de una manera minusiosa). Finalmente llegamos a la parte donde se encontraban los dispositivos de almacenamiento de datos, servidores de varios tipos (hasta servidores Apple) formaban el ejercito de discos duros que almacenan millones de bytes en información relacionadas con los observatorios.

Days 3 & 4 : BTRFS Raids and more troubles

El dia de ayer miércoles fue un día triste para el avance del proyecto “backblaze pod”.

Pero, ¿Qué fue lo que pasó? . En realidad no mucho. Hemos estado luchando con la configuración de RAID 1+0.

¿Problemas? Sí, bastantes. Sin embargo, estamos haciendo las pruebas de posibles fallas de dispositivos I/O de inmediato para así realizar un sistema ‘failproof’.

¿Cuál ha sido el mayor inconveniente en estos días? Al hacer el sistema de archivos de forma que abarque todos los dispositivos SATA II (sdx) al simular una falla de un dispositivo y querer montar el sistema nuevamente con el comando mount el sistema no es capaz de reconstruir el sistema de archivos de manera que éste quede operacional nuevamente.

Los comandos que hemos utilizado son los siguientes (extraídos de la página oficial de btrfs):

Replacing Failed Devices

The btrfs-vol example above can be used to remove a failed device if the super block can still be read. But, if a device is missing or the super block has been corrupted, the filesystem will need to be mounted in degraded mode:

mkfs.btrfs -m raid1 /dev/sdb /dev/sdc /dev/sdd /dev/sde
# sdd is destroyed or removed, use -o degraded to force the mount
# to ignore missing devices
mount -o degraded /dev/sdb /mnt
# 'missing' is a special device name
btrfs-vol -r missing /mnt

btrfs-vol -r missing tells btrfs to remove the first device that is described by the filesystem metadata but not present when the FS was mounted.

El error que nos indica el sistema con el comando:

device fsid 40895d47368bf3-5ee445d21006ee99 devid 1 transid 35 /dev/sdb1
btrfs: allowing degraded mounts
btrfs: failed to read chunk root on sdb1
btrfs: open_ctree failed
device fsid 40895d47368bf3-5ee445d21006ee99 devid 1 transid 35 /dev/sdb1
btrfs: allowing degraded mount
btrfs: failed to read chunk root on sdb1
btrfs: open_ctree failed

He ahí el dilema de btrfs al tratar de montar el sistema incompleto y las hipótesis de porque el sistema no lo permite está en alguna de estas posibles razones:

  • El error indica que no es posible leer la raíz del chunktree que se encuentra en el dispositivo sdb1 es por esto que al montar el sistema de archivos el sistema reclame al estar incompleto.
  • El kernel que utilizamos en Fedora 12 no soporte de manera optima la utilización de multi discos y la supuesto fix o force mount que tratamos de utilizar no está funcionando.

Image:chunks-overview.png

Tan sólo cabe esperar por nuevos features del kernel nuevo o simplemente esperar a que la misticidad nos ayude a recuperar un sistema incompleto.

Proximamente se viene la presentación del ‘rojito’ , la instalación de Fedora12 y posiblemente algunos discos corriendo en BTRFS.

Day 2: BTRFS & ‘Troubles’

Hola a tod@s, hoy Martes 05 de Enero de 2010 es mi segundo dia de practica profesional en las oficinas del Cerro Tololo en La Serena.

Lo realizado hoy se los cuento a continuación:

  • Crear particiones en los discos y luego darles un formato de sistema de fichero (file system de ahora en adelante FS) con los siguientes comandos para después montarlos .

      # crear filesystem
      mkfs.btrfs /dev/sdb1
     # montar dispositivo
      mount /dev/sdb1 /mnt/btrfs

Cabe recordar que la configuración de los dispositivos de almacenamiento en la que se está trabajando es de 5 discos SATA II conectados en una controladora PCI y un port multiplier.

Ahora bien, el desafio es el siguiente: ¿Cómo decirle al sistema operativo que administre los discos duros de forma ordenada y limpia para poder aprovechar los 7.5 TB que estamos conectando?

Es por esto que se realizaron las siguientes pruebas:

  • Agregar dispositivos sin FS  al punto de montaje para generar un grupo de dispositivos en un solo punto de montaje y así tener una capacidad de almacenamiento igual a la suma de la capacidad de los dispositivos. Esto se realizó usando el siguiente comando:

# agregar volumen al punto de montaje
btrfs-vol -a /dev/sdc1 /mnt/btrfs
#eliminarlo
btrfs-vol -r /dev/sdc1 /mnt/btrfs

Si se quisiese desmontar el dispositivo se debe ocupar el mismo comando, pero, con la opción -r para eliminar el volumen del punto de montaje.Las pruebas comenzaron al empezar a simular la falla de un disco y los resultados fueron los siguientes:

  • Si se reinicia la maquina, al tratar de montar sdc1, no lo permite (envia un error de “corrupcion”). Por otro lado, si se monta sdb1, lo permite y asocia, inmediatamente, el otro volumen como propio (es decir, el espacio de lo montado es la suma de los anteriores, sin errores de corrupcion).
  • Si se apaga el equipo, se quita fisicamente el sdc1 y luego se vuelve a encender la maquina, si se trata de montar nuevamente sdb1, el sistema completo se caera, quedando como unica opcion reiniciar la maquina (no solo no permite montar el disco (no envia error al respecto), sino que colapsa el sistema operativo tambien).
  • Si se apaga el equipo, se reemplaza fisicamente el sdc1 por otro disco duro equivalente en tamaño y luego se vuelve a encender la maquina, si se trata de montar nuevamente sdb1, el sistema completo se caera, quedando como única opción reiniciar la maquina (no solo no permite montar el disco (no envia error al respecto), sino que colapsa el sistema operativo también).
  • Si se apaga el equipo, se cambia fisicamente el sdc1 a sdd1, se agrega un nuevo disco duro a sdc1 y luego se vuelve a encender la maquina, si se trata de montar nuevamente sdb1, funcionara sin problemas y reconocerá a sdd1 como parte de la unidad montada (que antiguamente era sdc1).
  • Si se apaga el equipo, y se cambia de posicion el sdb1 (a sdd1 por ejemplo), si se trata de montar nuevamente el antiguo sdb1 (sdd1), funcionara sin problemas.

Conclusiones de las pruebas:

Los siguientes casos funcionaran sin problemas:

  • Al reiniciar la maquina, sin cambiar de posicion los discos.
  • Se cambian de posicion los hdd. Se puede cambiar cualquiera de los dos hdd a cualquier posicion. La única exigencia es que ambos deben estar conectados y funcionando.

Lo que se está realizando en estos momentos es:

Con la premisa de que al tener dos discos duros de 1.5TB cada uno formando un solo sistemas de archivos de 3TB , se crearon 170 ficheros de 10GB cada unos para poder confirmar que está ‘unión’ de manera correcta, y posteriormente hacer pruebas de distribución de archivos en los extents de los discos duros.

Bueno eso es un resumen de lo que realizamos hoy en la práctica y espero seguir registrando cada proceso en este interesante proyecto.

Get Adobe Flash playerPlugin by wpburn.com wordpress themes