martes, 9 de diciembre de 2008

Qué es Oracle Real Application Clusters?

Real Application Clusters es un software que permite utilizar un cluster de servidores ejecutando multiples instancias sobre una misma base de datos. Los archivos de base de datos quedan almacenados en discos física o lógicamente conectados a cada nodo, de modo tal que todas las instancias activas pueden leerlos o escribirlos.

El software de RAC maneja el acceso a los datos, de modo tal que los cambios en los datos son coordinados entre las instancias y cada instancia ve imágenes consistentes de la base. El interconnect del cluster permite que las instancias se pasen entre ellas información de coordinación e imágenes de los datos.

Esta arquitectura permite que los usuarios y aplicaciones se beneficien de la potencia de procesamiento de múltiples máquinas. La arquitectura RAC también ofrece redundancia; por ejemplo, en el caso de que un nodo quede inutilizado, la aplicación continuará accediendo a los datos via el resto de las instancias disponibles.

La base y la instancia

Una base de datos Oracle es una estructura compleja compuesta por numerosos archivos, procesos y estructuras de memoria interactuando para formar un completo y robusto sistema de base de datos.

Muchas veces se utiliza en forma indistinta los terminos “base de datos oracle” o “instancia oracle”. Sin embargo, esto se debe a una falta de conocimiento acerca de como opera un sistema de base de datos Oracle. Una base de datos Oracle esta compuesta por todos los items almacenados en disco; mientras que una instancia Oracle esta formada por memoria y procesos que operan en el servidor. En otras palabras; una instancia Oracle es logica, mientras que una base de datos Oracle es fisica. ¿Como se relacionan? Los usuarios no acceden a la base de datos directamente, lo hacen a traves de la instancia. En otras palabras, un usuario no puede leer o escribir directamente los archivos de la base de datos que estan en disco, sino que accede a los datos a traves de la instancia.

Una base de datos Oracle puede ser abierta por varias instancias Oracle en forma concurrente. Este esquema de una base Oracle con multiples intancias Oracle se conoce como Real Application Clusters. Una instancia puede abrir solo una base por vez.

¿Qué es ASM?

ASM es a la vez un file system y un volume manager integrado, creado específicamente para archivos de bases de datos Oracle.
ASM es una solución muy interesante que nos brinda Oracle ya que nos ofrece la alta performance de los raw devices y la facilidad de administración de un file system.
ASM permite dividir todo el storage disponible en diskgroups. Luego uno administra los diskgroups, y ASM automatiza la ubicación de los archivos dentro de los diskgroups.
Cuando utilizamos ASM en las sentencias SQL de creación de estructuras (tablespaces, control files, archive log files) se especifica la ubicación en términos de diskgroups. ASM crea y administra los archivos dentro de los diskgroups sin necesidad de intervención humana.
ASM brinda además, capacidades adicionales de mirroring y striping, dividiendo los archivos en extensiones de 1Mb. y distribuyéndolos entre los discos que componen un diskgroup. Estas capacidades adicionales optimizan el rendimiento del sistema y la utilización de disco, haciendo que el tuning manual de input-output sea prácticamente innecesario.
La forma en que ASM administra el mirroring (espejado) es incluso más flexible que el espejado vía sistema operativo ya que ASM permite especificar el nivel de redundancia a nivel de archivo. De este modo, dos archivos pueden compartir el mismo diskgroup estando uno espejado y el otro no. Oracle administra el espejado a nivel de extensión; si un archivo está espejado, cada extensión de dicho archivo tendrá una o más copias dependiendo del nivel de redundancia configurado para dicho archivo. Las copias espejadas siempre residen en diferentes discos de distintos diskgroups. ASM soporta tres opciones de espejado a nivel de archivo:

* 2-way mirroring: cada extensión tiene una copia
* 3-way mirroring: cada extensión tiene dos copias
* desprotegido: sin espejado. Se utiliza cuando el espejado es provisto por el propio subsistema de discos.

ASM se implementa como una instancia Oracle, con su propia SGA y procesos background. Una configuración “single instance” de ASM puede dar servicio a una o más bases de datos también single instance, todo residente en un solo servidor. Cada diskgroup ASM puede ser compartido por todas las bases de datos del servidor.

En un ambiente clusterizado, cada nodo corre una instancia ASM, y las instancias ASM se comunican entre ellas mediante una relación peer-to-peer. Esta arquitectura es válida tanto para un entorno RAC o no RAC (en el que múltiples bases de datos “single instance” residen en diversos nodos compartiendo el mismo storage administrado por ASM.

Oracle RAC y tecnologías de storage compartido

Tradicionalmente el storage estaba conectado directamente al servidor (configuración denominada Directly Attached Storage o DAS). En los últimos años han aparecido configuraciones más flexibles que permiten el acceso sobre redes de storage (redes SAN) o redes Ethernet (NAS). Estas nuevas alternativas de configuración permiten que múltiples servidores accedan a los mismos conjuntos de discos, simplificando la administración de espacio en disco en ambientes distribuidos.

Para el caso particular de Oracle RAC hay al menos 3 posibles configuraciones para suministrar el acceso compartido al storage:

*
Raw volumes son dispositivos conectados directamente al servidor (DAS) que requieren discos que operan en modo bloque (fiber channel o iSCSI)
*
Cluster File System uno o más file systems en cluster pueden utlizarse para todos los archivos de RAC. En este caso también se necesitan dispositivos trabajando en modo bloque como fiber channel o iSCSI.
*
Automatic Storage Management (ASM) Es un Cluster File System dedicado para archivos de bases de datos Oracle.

Almacenamiento en Oracle RAC: raw devices, Cluster File System y ASM

Un sistema de archivos tradicional (file system) es una estructura de árbol compuesta por directorios y archivos que se implementa a traves del kernel del sistema operativo. El sistema de archivos utiliza el concepto de buffering de cache optimizando el número de veces que el sistema operativo debe acceder al disco. El sistema de archivos toma el control de las operaciones de entrada/salida liberando a los procesos de esta operación y permitiéndoles continuar con otras operaciones. El sistema de archivos retiene en cache los datos a escribir hasta tener múltiples datos para procesar en forma conjunta, lo cual mejora el rendimiento del sistema.

En una arquitectura de Oracle RAC dos o mas instancias en servidores separados compartirían un mismo sistema de archivos pues el almacenamiento es único para ambas instancias. Sin embargo los sistemas de archivos tradicionales provistos por Unix no ofrecen esta prestación; es decir que dos servidores Unix no pueden compartir un mismo file system.

Las opciones que propone Oracle para poder implementar un sistema de múltiples instancias sobre un almacenamiento único son tres: raw devices, Cluster file System (CFS) y Automatic Storage Management (ASM). A continuación, un detalle de cada opción.

Raw Devices
Un raw device es una región contigua de un disco accedida a través de una interface que provee acceso “crudo” al sistema de entrada/salida. Al decir acceso “crudo” estamos diciendo que no es a través del sistema de archivos. En Unix, esta interface se implementa con un dispositivo de caracter (character-device). De este modo se logra un acceso directo entre un proceso y un disco lógico. En una implementación de este tipo, la ejecución de una operación de escritura hecha por un proceso moverá los datos al dispositivo en forma directa (no a través del file system). Si bien esta solución es muy eficiente (sobre todo en un sistema con alta contención de entrada/salida), es la mas compleja de todas las opciones desde el punto de vista administrativo.

Cluster File System (CFS)
Los sistemas de archivos en cluster (CFS) permiten que múltiples servidores puedan acceder al mismo sistema de archivos. CFS resuelve las desventajas y complejidades de los raw devices proveyendo una solución más simple para la administración del almacenamiento. Oracle soporta diversos tipos de CFS: Oracle Cluster File system (OCFS), Veritas Cluster File System (VCFS), IBM GPFS, Tru64 File System. La desventaja de esta solución es su costo, dado que las alternativas provistas por los diversos vendors requerirán de su correspondiente licencia. En el caso de Oracle Cluster File System (OCFS), si bien es libre, sólo está disponible para entornos Linux y Windows.

Automatic Storage Management (ASM)
Automatic Storage Management es la solución provista y elegida por Oracle que virtualiza el acceso al almacenamiento actuando como interface entre una instancia Oracle y el dispositivo de almacenamiento que contiene los datos. ASM provee tanto las prestaciones de un file system como las de un volume manager. ASM se implementa como una instancia Oracle que deberá estar presente en cada uno de los nodos que conforman el cluster. ASM es la solución mas recomendada por Oracle. Implementando ASM se evita la complejidad de los raw devices y se evita el costo económico de licenciamiento de Cluster File System.