Usando Servidores SPARC Oracle

LCM::: INFORMÁTICA:::

TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle

Sistemas de TI indisponíveis podem comprometer os resultados dos negócios na forma de redução da lucratividade, redução da produtividade dos funcionários, alteração na fidelidade do cliente e até mesmo a incapacidade de continuar como uma empresa viável. À medida que as organizações batalham para minimizar o tempo de inatividade planejado e não planejado, a importância das escolhas de infraestrutura de TI, habilidades administrativas e processos operacionais aumenta. Os servidores SPARC Enterprise M-Series da Oracle, o Oracle® Solaris, o Oracle Solaris Cluster e serviços educacionais e profissionais da Oracle podem ajudar as organizações a maximizar a disponibilidade de serviços de TI críticos para os negócios. Ao assumir uma abordagem abrangente para a disponibilidade, as organizações também podem obter diversas vantagens comerciais, incluindo mais oportunidades de receita, custos mais baixos, maior flexibilidade para reagir a condições de negócios em constante mudança e melhor Retorno do Investimento.
Introdução
Uma falha no sistema que impede os clientes de acessarem aplicações críticas quase sempre resulta no bloqueio de fluxo de receita durante este período. Mesmo interrupções relativamente breves podem ter um enorme impacto financeiro. Por exemplo, quando as aplicações em um centro de processamento de cartões de crédito passam por um período de inatividade, os custos podem chegar a 2,6 milhões de dólares por hora. Um corretor financeiro comum perde até 6,5 milhões de dólares a cada hora que um sistema crítico não está funcionando e o tempo de inatividade de um sistema de reservas de uma companhia aérea pode resultar em custos de até 90.000 dólares por hora1.
1 O impacto financeiro do tempo de inatividade do sistema varia em função do modelo de negócios e características da interrupção. Todos os números apresentados são aproximações e não necessariamente baseados em eventos reais.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
2
A obtenção de altos níveis de disponibilidade depende de um relacionamento interdependente entre produtos, pessoas e processos. Embora a utilização de produtos de hardware e software altamente confiáveis seja importante para a criação de uma infraestrutura de TI confiável, as organizações devem também tomar medidas para impedir falhas no sistema que possam resultar de erros humanos e procedimentos falhos. As ofertas de produtos e serviços da Oracle trabalham para resolver cada um desses aspectos da disponibilidade. Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 altamente disponíveis da Oracle se unem ao Oracle Solaris e Oracle Solaris Cluster para criar uma infraestrutura confiável de hardware e software. Um amplo portfólio de serviços profissionais e educacionais da Oracle pode ajudá-lo a contribuir com a criação de uma organização de TI mais forte e capaz. Além disso, a Oracle oferece ferramentas de gerenciamento de sistema que podem automatizar procedimentos, ajudando organizações a aumentar a conformidade com práticas recomendadas e trabalhando para impedir falhas de sistema que possam resultar de simples erros administrativos.
Muito mais que apenas aumentar o tempo de atividade, a adoção da abordagem abrangente da Oracle para a maximização da disponibilidade pode resultar em diversas vantagens comerciais, incluindo o seguinte:
• Aumento da receita. Os produtos, turmas de treinamento e serviços da Oracle ajudam as organizações a minimizar o tempo de inatividade planejado e não planejado do sistema. Consequentemente, os serviços de TI podem obter níveis mais altos de disponibilidade, suportando a geração de receita durante mais horas no dia e mais dias na semana.
• Custos mais baixos. As ferramentas de gerenciamento da Oracle suportam a automação e aprimoramentos de processos administrativos. Além de reduzirem a oportunidade de tempo de inatividade causado por erro humano, essas ferramentas podem ajudar a aumentar a eficiência operacional, permitindo que os administradores de sistema gerenciem um número maior de servidores com menos esforço.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
3
• Maior Agilidade nos Negócios. Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 da Oracle podem ajudar as organizações a reagirem mais rapidamente às exigências comerciais em constante mudança, permitindo ajustes à capacidade de computação, sem implicar em tempo de inatividade.
• Melhor Retorno do Investimento. Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 suportam a criação de diversas partições de hardware, isoladas de falhas, com controle detalhado de recursos, ajudando a simplificar os esforços para maximizar os níveis de utilização do sistema.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
4
Abordagem abrangente da Oracle para disponibilidade
Hoje em dia, o sucesso de uma organização depende da disponibilidade dos serviços de TI. O tempo de inatividade do sistema, planejado ou não, pode afetar cronogramas, atrasar receitas e reduzir a satisfação do cliente. A abordagem abrangente da Oracle para maximização da disponibilidade trabalha com a função de produtos, pessoas e processos no tempo de atividade. As seções a seguir analisam mais detalhadamente as principais tecnologias e serviços da Oracle que podem ajudar as organizações a maximizar o tempo de atividade de serviços de TI críticos para os negócios.
Sistemas com confiabilidade do nível de mainframe
Especificamente projetados para suportar soluções corporativas de computação com rígidos requisitos de alta disponibilidade, os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 da Oracle (Figura 1) podem ser redimensionados de um para 64 processadores e podem incorporar até 4 TB de memória. Esses sistemas altamente confiáveis e verticalmente dimensionáveis são ideais para consolidação de servidor, nova hospedagem de mainframe, implantações de bancos de dados de larga escala e implantações de aplicações comerciais críticas.
Figura 1. Os servidores SPARC Enterprise M-Series são uma família escalonável de servidores de multiprocessamento simétrico (SMP) confiáveis e de alto desempenho.
A arquitetura avançada desses servidores confiáveis promove altos níveis de tempo de atividade individual do sistema e rápida recuperação a partir de diversos tipos de falhas de hardware. Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 incluem componentes de sistema redundantes e com tecnologia de hot-swap, opções de alimentação que se recuperam de falhas, recursos de diagnóstico e recuperação de erros por todo o projeto e recursos de gerenciamento remoto incorporado. Para suportar níveis ainda maiores de disponibilidade, o software Oracle Solaris Cluster pode ser usado para montar clusters que incluem uma combinação de até 16 servidores SPARC Enterprise M-Series e outros sistemas Sun.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
5
Os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 oferecem tecnologias de visualização de Domínios dinâmicos e Reconfiguração dinâmica (DR) para permitir a conclusão de tarefas de reconfiguração sem precisar desconectar o sistema. Os administradores podem adicionar ou reatribuir de forma dinâmica recursos de hardware para sistemas que precisam de capacidade de computação adicional. Consequentemente, as organizações podem reagir rapidamente às condições de negócios em constante mudança, simplificar o compartilhamento de recursos e criar eficiências que ajudam a melhorar o Retorno do Investimento.
O Oracle Solaris melhora ainda mais a disponibilidade dos servidores SPARC Enterprise M-Series. Construído com um kernel compacto e pequeno, o design do Oracle Solaris limita a exposição a erros que podem fazer com que o sistema fique inoperante. Além disso, o Oracle Solaris oferece recursos que ajudam a diagnosticar, isolar e recuperar de falhas de hardware e software de forma proativa.
Treinamento e Serviços profissionais
Experiência administrativa é essencial para obter os mais altos níveis de disponibilidade do sistema. A Oracle oferece diversos programas que ajudam as empresas a tirarem proveito de conhecimento e habilidades dos consultores técnicos, especialistas em aprendizagem e profissionais de suporte da Oracle para arquitetar, implantar e gerenciar uma implementação bem-sucedida. Os serviços profissionais ajudam a avaliar os requisitos gerais de disponibilidade e criar metodologias e estratégias que possam ajudar as organizações a obterem o nível exigido de tempo de atividade. A Oracle também oferece um portfólio completo de serviços de educação para ajudar as organizações a desenvolver as habilidades necessárias para construir e manter soluções comerciais seguras, escalonáveis e altamente disponíveis.
Automação de processos
As organizações podem aumentar seus níveis de disponibilidade garantindo que práticas recomendadas sejam seguidas de forma consistente. Fornecendo a capacidade de automatizar tarefas administrativas, o Oracle Solaris e o portfólio de poderosas aplicações de gerenciamento da Oracle ajudam a impor a utilização dos procedimentos corretos, evitando erros e simplificando o gerenciamento de ambientes complexos. As seguintes ferramentas de servidores SPARC Enterprise M-Series ajudam a reduzir o grau de interação humana e melhoram a precisão processual, resultando em aplicações com mais disponibilidade e custos mais baixos através de operações mais eficientes.
• O recurso eXtended System Control nos servidores SPARC Enterprise M-Series fornece capacidade de gerenciamento e monitoramento remotos e facilita a execução de uma ampla gama de tarefas administrativas.
• O software Oracle Enterprise Manager Ops Center ajuda as organizações a simplificar o gerenciamento de sistemas Sun, automatizando tarefas administrativas e de instalação, facilitando a conformidade com a geração de relatórios e suportando o gerenciamento de milhares de sistemas simultaneamente.
• O software Sun Management Center da Oracle fornece uma interface gráfica do usuário (GUI) para o monitoramento, administração e gerenciamento de servidores SPARC Enterprise M-Series, suportando o gerenciamento remoto de sistemas e operação de lights out.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
6
Minimização do tempo de inatividade planejado
As organizações de TI atuais são desafiadas pela necessidade de suportar operações de negócios que funcionam ininterruptamente, fazendo com que as janelas de tempo de inatividade planejadas sejam reduzidas e, em alguns casos, desapareçam completamente. Os servidores SPARC Enterprise M- Series podem ajudar a reduzir o tempo de inatividade planejado através de recursos que permitem que as aplicações continuem a ser executadas durante a execução de diversas tarefas de manutenção e configuração do sistema. Ao permitir ajustes dinâmicos à capacidade de computação, esses mesmos recursos também simplificam os esforços para maximizar os níveis de utilização de recursos e podem gerar um Retorno do investimento melhor.
Domínios dinâmicos
O recurso de Domínios dinâmicos oferecido pelos servidores SPARC Enterprise M4000, M5000, M8000 e M9000 suporta a divisão de um único sistema em servidores virtuais distintos, cada um executando uma cópia independente do Oracle Solaris e possuindo o uso de dispositivos de I/O designados. Quando os componentes do sistema estão exclusivamente dedicados a Domínios dinâmicos individuais, as falhas de hardware ou software em um único domínio permanecem isoladas e incapazes de impactar a operação de outros domínios, fornecendo maior disponibilidade de aplicações.
Os Domínios dinâmicos permitem que as organizações personalizem e ajustem a capacidade de computação dos servidores SPARC Enterprise M4000, M5000, M8000 e M9000 para atender a necessidades específicas de negócios. Por exemplo, um servidor SPARC Enterprise M9000 pode ser configurado como um único domínio com até 64 processadores para hospedar uma aplicação com uma quantidade excepcional de computação. Como alternativa, uma organização com diversos bancos de dados que exigem isolamento um do outro podem dividir um único servidor SPARC Enterprise M9000 em até 24 domínios. Configurações mais comuns envolvem três ou quatro domínios em um único servidor.
Os domínios, usados com grande sucesso no mundo dos mainframes por vários anos, provam ser igualmente úteis no mundo dos sistemas abertos. Esta abordagem de virtualização suporta diversas eficiências, incluindo o seguinte:
A utilização de Domínios dinâmicos para virtualizar servidores SPARC Enterprise M-Series pode ajudar as organizações a implantarem uma quantidade menor de sistemas físicos, ao mesmo tempo em que fornecem a privacidade necessária para o suporte de acordos do nível de serviço. Com menos servidores para gerenciar, os Domínios dinâmicos simplificam e unificam os esforços de administração, gerando um Custo total de propriedade reduzido.
Cada domínio dentro de uma única plataforma de servidor pode executar uma versão diferente do Oracle Solaris, tornando essa tecnologia extremamente útil para testes de pré-produção de aplicações ou softwares do sistema novos ou modificados.
eXtended System Boards
Para obter um isolamento de hardware completo, as gerações anteriores dos servidores Sun designavam placas de sistema inteiras como a menor unidade atribuível a um domínio. Entretanto, algumas organizações podem se beneficiar de um controle de recursos mais detalhado e da capacidade de criar um número mais alto de domínios. Para atender essas necessidades, os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 suportam eXtended System Boards (XSBs).
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
7
Existem dois tipos de eXtended System Boards. Uma Uni-XSB é composta de uma placa de sistema inteira ou placa de sistema lógica. Como alternativa, uma placa de sistema ou placa mãe que é logicamente dividida em quatro partes é chamada de Quad-XSB. Um Domínio dinâmico pode ser composto de qualquer combinação de Uni-XSBs e Quad-XSBs, facilitando a alocação de recursos. Por exemplo, um servidor SPARC Enterprise M4000 suporta até dois Domínios dinâmicos e é composto de uma única placa de sistema que pode ser configurada como um Uni-XSB com controle total de todos os recursos, ou pode ser dividida em uma configuração de quatro Quad-XSB. As linhas de divisão lógica para a criação de Quad-XSBs no servidor SPARC Enterprise M4000 são mostradas na Figura 2.
Figura 2. Um servidor SPARC Enterprise M4000 pode ser dividido em Quad-XSBs para permitir uma atribuição mais detalhada de recursos.
Um servidor SPARC Enterprise M5000 é construído como uma única placa mãe, apresentando duas placas de sistema lógicas. Cada placa de sistema lógica pode ser configurada como uma Uni-XSB ou Quad-XSB. Desta forma, existem três opções disponíveis para o particionamento de recursos de um servidor SPARC Enterprise M5000. Conforme mostrado na Figura 3, Figura 4 e Figura 5, um servidor SPARC Enterprise M5000 pode ser configurado como duas Uni- XSBs, oito Quad-XSBs ou uma combinação de uma Uni-XSB e quatro Quad-XSBs. Dentro do servidor SPARC Enterprise M5000, XSBs individuais podem ser atribuídas a até quatro domínios.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
8
Figura 3. Um SPARC Enterprise M5000 pode ser configurado como duas Uni-XSBs.
Figura 4. Um SPARC Enterprise M5000 pode ser configurado como oito Quad-XSBs.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
9
Figura 5. Um SPARC Enterprise M5000 pode ser configurado como uma combinação de uma Uni-XSB e quatro Quad-XSBs.
Os servidores SPARC Enterprise M8000 podem suportar até quatro placas de sistema e 16 Domínios dinâmicos. Os servidores SPARC Enterprise M9000 podem suportar até oito placas de sistema e 24 Domínios dinâmicos.
Cada placa de sistema nesses servidores pode ser configurada como uma Uni-XSB ou dividida em Quad-XSBs. Uma configuração Quad-XSB é mostrada na Figura 6.
Figura 6. Uma placa de sistema do SPARC Enterprise M8000 ou M9000 pode ser configurada como quatro Quad-XSBs.
A determinação do número e tipo exatos de XSBs para inclusão em um domínio exige um equilíbrio entre a necessidade de isolamento de falhas e o desejo de maximizar a utilização de recursos. A Tabela 1 ajuda a diferenciar as características das configurações Uni-XSB e Quad-XSB. Em geral, as Uni-XSBs oferecem o mais alto nível de isolamento de falhas enquanto as Quad-XSBs oferecem maior detalhamento em relação à divisão de recursos.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
10
TABELA 1. COMPARAÇÃO DE ALTO NÍVEL DAS CARACTERÍSTICAS DAS CONFIGURAÇÕES UNI-XSB E QUAD-XSB
UNI-XSB
QUAD-XSB
• Criação de domínios físicos — limites no nível de placa
• Divisão lógica — limites no nível de placa de subsistema
• Melhor isolamento de falhas
• Melhor utilização de recursos
• Adequada para a configuração de uma grande quantidade de recursos
• Adequada para a configuração de domínios de pequena escala
• A falha de uma única Uni-XSB implica em um maior impacto no desempenho
• A falha de uma única Quad-XSB pode afetar mais de um domínio
Imposição de isolamento de domínio
Os domínios executam aplicações totalmente isoladas de aplicações sendo executadas em outros domínios. O isolamento e segurança entre os domínios é mantido por um importante ASIC chamado de Controlador do Sistema (SC). O SC garante que um domínio não acesse pacote de dados de outro domínio. Os ASICs SC em cada placa de sistema são responsáveis pelo acesso ao caminho de dados. No caso de a placa de sistema ser colocada em modo quádruplo, o SC restringe ainda mais os caminhos de dados. Isso se aplica a outras XSBs na mesma placa, bem como o endereçamento de outra XSB nas placas, com dados transferidos através da Unidade Crossbar.
Reconfiguração on-line, manutenção e atualizações
Devido às contantes mudanças nas prioridades da área de negócios, os gerentes de TI frequentemente precisam de recursos para ajustar a quantidade de capacidade de computação atribuída à carga de trabalho de cada aplicação. A tecnologia de Reconfiguração dinâmica (DR) fornece valor agregado a Domínios dinâmicos permitindo que os recursos alternem sem deixar o sistema inoperante. Usando a tecnologia de Reconfiguração dinâmica, os administradores podem executar alterações físicas e lógicas em recursos de hardware do sistema enquanto o servidor continua a executar as aplicações.
A capacidade de remover ou adicionar componentes como CPUs, memória e subsistemas de I/O enquanto um sistema continua a ser executado pode ajudar a reduzir o tempo de inatividade do sistema planejado para a reconfiguração de capacidade, tarefas de manutenção e atualizações. Na verdade, a Reconfiguração dinâmica simplifica essas tarefas eliminando a necessidade de o sistema reinicializar após alterações na configuração de hardware. Diversas operações de DR podem ser executadas simultaneamente para o gerenciamento eficiente de recursos. Esse recurso ajuda administradores de domínio independentes a executarem operações de DR simultaneamente sem se preocupar com o status das solicitações de DR ou execuções em outros domínios.
Os exemplos a seguir demonstram como a Reconfiguração dinâmica pode ajudar as organizações a reduzirem drasticamente o tempo de inatividade planejado para as atividades de manutenção e ajustes de suporte à capacidade de computação de um Domínio dinâmico.
• Atualizações on-line. Diversos sistemas de computação essenciais precisam da capacidade de reagir rapidamente a cargas não previsíveis enquanto continuam a fornecer serviços críticos. As atualizações on-line facilitam a rápida instalação de capacidade adicional dentro de sistemas SPARC Enterprise M4000, M5000, M8000 e M9000 (às vezes, instantaneamente) sem interrupção. Ao utilizar este recurso, é possível adicionar outros processadores, memória, I/O e dispositivos de armazenamento a um Domínio dinâmico sem desligar o processamento da aplicação ou exigir que o sistema seja reinicializado.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
11
• Manutenção simultânea. Os administradores são, cada vez mais, desafiados a criar janelas de tempo de inatividade planejado para executar o serviço necessário em sistemas essenciais. Como os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 são equipados com componentes redundantes, as falhas não mais necessariamente resultam em tempo de inatividade do servidor. Entretanto, a substituição de componentes com defeito ou degradados deve ocorrer em algum momento. A Reconfiguração dinâmica simplifica as operações oferecendo suporte à execução da remoção do componente e tarefas de instalação enquanto o sistema continua a operar.
• Ajustes automatizados da capacidade de computação. A Reconfiguração dinâmica automática (ADR) suporta a execução de operações de Reconfiguração dinâmica sem a interação de um usuário. As atividades de ADR são disparadas por eventos pré-definidos do sistema configurados por um administrador de sistema. Por exemplo, uma configuração de ADR pode ser criada para permitir a adição automática de uma placa de sistema quando uma aplicação crítica de negócios atingir a capacidade total de utilização da CPU. As implementações podem incluir tarefas preparatórias específicas para cada aplicação antes de uma operação de DR, a execução de ações de recuperação de erro durante a DR, e procedimentos de limpeza após a conclusão da DR.
• Capacidade sob demanda. A opção de Capacidade sob demanda (COD) ajuda os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 a obter acesso imediato a capacidade adicional no caso de falta de recursos. Por exemplo, se um pico na demanda criar uma queda no desempenho do nível de serviço, a configuração de capacidade de computação adicional pode ocorrer muito rapidamente movendo uma placa de sistema COD para o domínio de destino. Os recursos COD permanecem off-line e sem carga até serem realmente exigidos. Quando é necessário capacidade de processamento adicional, as placas de sistema COD podem ser configuradas imediatamente no sistema através da compra da opção de ativação de hardware COD para cada CPU adicional.
Reduzindo o tempo de inatividade não planejado
O tempo de inatividade não planejado pode ser extremamente oneroso para as organizações. Além da perda de transações comerciais, o custo real do tempo de inatividade não planejado também inclui despesas relacionadas à produtividade perdida do funcionário e a redução da satisfação do cliente. Para ajudar as organizações a evitarem o tempo de inatividade não planejado, os servidores SPARC Enterprise M-Series incluem redundância incorporada e configurável, componentes com tecnologia hot-swap e recursos avançados de confiabilidade que facilitam a rápida recuperação ou operação contínua apesar das condições de erro. A Tabela 2 lista componentes redundantes e com tecnologia hot-swap disponíveis para servidores SPARC Enterprise M-Series.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
12
TABELA 2. COMPONENTES REDUNDANTES E COM TECNOLOGIA HOT-SWAP AJUDAM A AUMENTAR A DISPONIBILIDADE DO SISTEMA E FACILITAM A MANUTENÇÃO
COMPONENTES REDUNDANTES
COMPONENTES COM TECNOLOGIA HOT-SWAP
SERVIDORES SPARC ENTERPRISE M3000
• Unidades de Disco
• Unidades de Fonte de Alimentação
• Unidades de Ventilador
• Unidades de Disco
• Unidades de Fonte de Alimentação
• Unidades de Ventilador
SERVIDORES SPARC ENTERPRISE M4000 E SERVIDORES SPARC ENTERPRISE M5000
• Controladores de sistema internos
• Unidades de Disco
• Unidades de Fonte de Alimentação
• Unidades de Ventilador
• Unidade de expansão de I/O externa (opcional)
• Unidades de Disco
• Unidades de Fonte de Alimentação
• Unidades de Ventilador
• Unidade de expansão de I/O externa (opcional)
• Placas PCI
SERVIDORES SPARC ENTERPRISE M8000 E SERVIDORES SPARC ENTERPRISE M9000
• Controladores de sistema internos
• Unidades de Disco
• Unidades de Fonte de Alimentação
• Ventiladores em Unidade de Bandeja de Ventilador
• Donte de Alimentação Dupla (opcional)
• Unidades de Placa de Memória da CPU
• Unidades de I/O
• Unidade de expansão de I/O externa (opcional)
• Unidades de Recurso eXtended System Control
• Unidades Crossbar
• Placa de Clock (Somente M9000)
• Unidades de Disco
• Unidades de Fonte de Alimentação
• Unidades de Ventilador
• Unidades de Placa de Memória da CPU
• Unidades de I/O
• Unidade de expansão de I/O externa (opcional)
• Placas PCI
• Unidades de DVD-ROM
• Unidade de fita
• Recurso eXtended System Control Unidades
Redundância de hardware incorporada
Os principais componentes dos servidores SPARC Enterprise M-Series que oferecem redundância incorporada para ajudar a evitar tempo de inatividade não planejado são descritos nas seções a seguir.
Arquitetura de barramento de sistema multicaminho
Cada servidor SPARC Enterprise M4000, M5000, M8000 e M9000 inclui um nível de redundância dentro do barramento do sistema. Essas interconexões variam em implementação, mas compartilham muitas das mesmas características, fornecendo endereço, dados e transporte de controle combinados. Os barramentos do sistema são caminhos unidirecionais com endereço e dados multiplexados, além de controle e ECC em cada direção. A placa mãe nos servidores SPARC Enterprise M4000 e M5000, e a unidade de CPU/placa de memória nos servidores SPARC Enterprise M8000 e M9000 contêm múltiplos controladores de sistema (SC), melhorando a confiabilidade e o desempenho.
A arquitetura da interconexão do sistema nesses servidores fornece mais que apenas excelente confiabilidade. Ao implementar um barramento ponto-a-ponto e usar tecnologia de troca de pacotes, múltiplos fluxos de dados podem ser transmitidos, melhorando o desempenho e o tempo de resposta. Por exemplo, a interconexão do servidor implementada no servidor SPARC Enterprise M9000 fornece 304,2 GB/segundo de largura de banda de pico, oferecendo 7,5 vezes mais throughput do sistema que os servidores Sun Fire E20K e Sun Fire E25K, enquanto mantém uma latência semelhante.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
13
Arquitetura do Servidor SPARC Enterprise M4000
O servidor SPARC Enterprise M4000 é implementado dentro de uma única placa mãe e apresenta uma placa de sistema lógica com dois controladores de sistema. Os dois controladores de sistema conectam-se um ao outro, bem como os módulos de CPU, controladores de endereço de memória e a IOU (Figura 7).
Figura 7. A interconexão do sistema do servidor SPARC Enterprise M4000 apresenta dois controladores de sistema.
Arquitetura do Servidor SPARC Enterprise M5000
O sistema do SPARC Enterprise M5000 é implementado dentro de uma única placa mãe, mas apresenta duas placas de sistema lógicas. Semelhantemente ao projeto do servidor SPARC Enterprise M4000, cada placa de sistema lógica contém dois controladores de sistema que se conectam um ao outro, bem como módulos de CPU, controladores de acesso de memória e uma IOU. Além disso, cada controlador de sistema se conecta a um controlador de sistema correspondente na placa de sistema lógica (Figura 8).
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
14
Figura 8. A interconexão do sistema do servidor SPARC Enterprise M5000 inclui quatro controladores de sistema.
Arquitetura do Servidor SPARC Enterprise M8000 e M9000
Os servidores SPARC Enterprise M8000 e M9000 apresentam múltiplas placas de sistema que conectam a uma crossbar comum. Cada placa de sistema contém quatro controladores de sistema e cada controlador de sistema se conecta a todos os módulos de CPU. Para melhor largura de banda, cada controlador de memória se conecta a dois controladores de sistema, e cada controlador de sistema se conecta a todos os outros controladores de sistema dentro da placa de sistema. Os controladores de sistema também fornecem uma conexão para cada unidade de crossbar, suportando a transferência de dados a outras placas de sistema (Figura 9).
Além da redundância na interconexão do sistema, a maioria das peças internas do chip do clock do servidor SPARC Enterprise M9000 é redundante. Existem duas fontes de sinal de clock e uma linha de sinal dupla é implementada entre o chip do clock e as placas de sistema. Ao implementar rotas de barramento redundantes, o servidor SPARC Enterprise M9000 pode reiniciar automaticamente caso uma rota falhe. A rota de sobrevivência é usada para continuar a operação.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
15
Figura 9. A arquitetura dos servidores SPARC Enterprise M8000 e M9000 fornece controladores de sistema redundantes em cada placa de sistema e interconexões de crossbar redundantes entre placas de sistema.
Processador de serviços — Recurso eXtended System Control
Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 usam um Recurso eXtended System Control (XSCF) para as funções de operação, monitoramento e notificação de diagnóstico e erros do sistema. O XSCF é um processador de serviços que opera independentemente do sistema de servidor principal e aumenta a capacidade de gerenciamento. O componente XSCF é projetado com recursos que melhoram a disponibilidade do processador de serviços. Por exemplo, o XSCF fornece duas interfaces Ethernet para suportar uma conexão de rede redundante para uma LAN administrativa, bem como uma porta de interface para o anexo de uma fonte de alimentação ininterrupta.
Os servidores SPARC Enterprise M8000 e M9000 apresentam placas XSCF redundantes. Uma placa XSCF permanece em modo de standby, pronta para assumir as operações no caso de uma falha do XSCF principal. O XSCF nos servidores SPARC Enterprise M8000 e M9000 também possui tecnologia hot-swap, suportando a manutenção do XSCF sem afetar a operação do servidor.
Alimentação redundante e resfriamento
Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 usam módulos separados para alimentação e resfriamento. A redundância em cada um desses subsistemas associado a sensores de temperatura colocados por todo o sistema mantém os servidores operando mesmo em caso de falha de alimentação ou do ventilador. Os sensores medem temperaturas nos processadores e principais ASICs, bem como a temperatura ambiente em diversos locais. A especificação de alimentação e resfriamento dos servidores SPARC Enterprise M3000, M4000 e M5000 estão incluídas na Tabela 3 e as especificações de alimentação e resfriamento dos servidores SPARC Enterprise M8000 e M9000 estão incluídas na Tabela 4.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
16
TABELA 3. RECURSOS DE ALIMENTAÇÃO E RESFRIAMENTO DOS SERVIDORES SPARC ENTERPRISE M3000, M4000 E M5000
SERVIDOR SPARC ENTERPRISE M3000
SERVIDOR SPARC ENTERPRISE M4000
SERVIDOR SPARC ENTERPRISE 5000
UNIDADES DE VENTILADOR
• 2 unidades de ventilador
• 2 ventiladores de 80 mm
• 1+1 redundante
• 4 unidades de ventilador
• 2 ventiladores de 172 mm
• 2 ventiladores de 60 mm
• 1 de cada tipo é redundante
• 4 unidades de ventilador
• 4 ventiladores de 172 mm
• 2 grupos de ventilador, cada um contendo
• 2 unidades de ventilador
• 1 ventilador redundante por grupo de ventilador
UNIDADES DE FORNECIMENTO DE ENERGIA•505 W
• 2 unidades
• 1+1 redundante
• Monofásico
• Fornecimento de energia de CA ou CC
• 2350 W
• Potência máxima Consumo: 1390 W
• 1 unidade
• 1+1 redundante
• Monofásico
• 4590 W
• Potência máxima Consumo: 2381 W
• 4 unidades
• 2 + 2 redundantes
• Monofásico
CABOS DE ENERGIA
• 2 cabos de energia
• 1+1 redundante
• 2 cabos de energia
• 1+1 cabo de energia redundante
• 4 cabos de energia
• 2+2 cabos de energia redundantes
TABELA 4. RECURSOS DE ALIMENTAÇÃO E RESFRIAMENTO DOS SERVIDORES SPARC ENTERPRISE M8000 E M9000
SERVIDOR SPARC ENTERPRISE M8000
SERVIDOR SPARC ENTERPRISE M9000-32
SERVIDOR SPARC ENTERPRISE M9000-64
UNIDADES DE VENTILADOR
• 12 unidades de ventilador
• 4 ventiladores de 172 mm
• 8 ventiladores de 60 mm
• N+1 redundante
• 16 unidades de ventilador
• 16 ventiladores de 172 mm
• N+1 redundante
• 32 unidades de ventilador
• 32 ventiladores de 172 mm
• N+1 redundante
UNIDADES DE FORNECIMENTO DE ENERGIA
• 10.500 W
• Potência máxima Consumo: 7,6 W
• 9 unidades
• N+1 redundante
• 21.300 W
• Potência máxima Consumo: 14,9 W
• 15 unidades
• N+1 redundante
• 42.600 W
• Potência máxima Consumo: 30,4 W
• 30 unidades
• N+1 redundante
OPÇÕES
• Monofásico
• Trifásico
• Grade dupla
• Monofásico
• Trifásico
• Grade dupla
• Monofásico
• Trifásico
• Grade dupla
CABOS DE ENERGIA
• 3 cabos de energia (alimentação única)
• 6 cabos de energia (alimentação dupla)
• 2 cabos de energia (trifásico)
• 5 cabos de energia (alimentação única)
• 10 cabos de energia (alimentação dupla)
• 2 cabos de energia (trifásico)
• 10 cabos de energia (alimentação única)
• 20 cabos de energia (alimentação dupla)
• 4 cabos de energia (trifásico)
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
17
Unidades de Ventilador
Os servidores SPARC Enterprise M-Series usam ventiladores com tecnologia hot-swap totalmente redundantes como o sistema de resfriamento principal. Se qualquer um dos ventiladores falhar, o XSCF detecta a falha e alterna os ventiladores restantes para a operação em alta velocidade para compensar pelo fluxo de ar reduzido. Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 podem operar normalmente nessas condições, fornecendo um grande período de tempo para fazer a manutenção da unidade com defeito. Além disso, a substituição de unidades de ventilador pode ocorrer sem a interrupção da operação da aplicação.
Fornecimento de Energia
O uso de unidades de fornecimento de energia e cabos de energia redundantes aumenta a flexibilidade a falhas dos servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000. A energia é fornecida a esses servidores através de unidades de fornecimento de energia redundantes, suportando a operação contínua do servidor, mesmo em caso de falha do fornecimento de energia. Como as unidades de energia têm tecnologia hot-swap, a remoção e substituição pode ocorrer enquanto o sistema continua em operação.
Como opção, os servidores SPARC Enterprise M8000 e M9000 podem ser solicitados com uma fonte de alimentação trifásica e o gabinete correspondente do servidor. Os modelos com uma fonte de alimentação trifásica permitem duas configurações, uma conexão em estrela que conecta uma linha neutra e cada fase, e uma conexão delta que conecta cada fase.
Alimentação de Energia Dupla Opcional
Os servidores SPARC Enterprise M8000 e M9000 podem ter alimentação de energia dupla. O subsistema de alimentação de CA nesses servidores é totalmente duplicado, fornecendo a opção de recepção de energia de fontes de alimentação de CA externas que são independentes entre elas. O uso de uma alimentação de energia dupla e fontes de alimentação redundantes aumenta a disponibilidade do sistema, uma vez que as operações do servidor podem permanecer inalteradas mesmo após uma falha na grade de alimentação única.
Configuração de redundância de sistema adicional
Os recursos de expansão dos servidores SPARC Enterprise M4000, M5000, M8000 e M9000 ajudam a suportar a configuração de números redundantes de processadores, memória DIMMs e dispositivos de I/O. A configuração de um sistema com mais processadores, memória, ou componentes de I/O que o necessário para uma determinada carga de trabalho cria essencialmente um conjunto de sobressalentes on-line que podem ajudar a acelerar a retomada do serviço. Por exemplo, no caso de uma falha de processador, o servidor SPARC Enterprise M-Series pode reiniciar, isolar e desativar o processador com defeito e, em seguida, executar sobre os processadores restantes em boas condições.
As organizações podem criar configurações com níveis de redundância do sistema para cada um dos seguintes componentes para corresponder às necessidades específicas da empresa.
• CPU e memória. Os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 suportam a criação de configurações de processamento redundantes com até 64 processadores e até 4 TB de memória. Além disso, recursos de CPU e memória dinamicamente reconfiguráveis facilitam a adição ou remoção ativa da capacidade de computação sem interromper a operação do sistema.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
18
• I/O incorporada. Os compartimentos internos de expansão de PCI nos servidores SPARC Enterprise M-Series fornecem conectividade a dispositivos externos. Ao combinar esses compartimentos de expansão com software opcional de gerenciamento de discos, a configuração do sistema pode incluir facilmente múltiplas conexões a dispositivos periféricos, fornecendo controladores e canais redundantes. As ferramentas de software podem também manter os diversos caminhos e facilitar uma troca para um caminho alternativo no caso de falha do caminho principal. Além disso, a Reconfiguração dinâmica pode adicionar ou remover toda uma unidade de I/O e placas PCI instaladas do sistema do SPARC Enterprise M8000 ou SPARC Enterprise M9000 durante operações ativas.
• Unidade de expansão de I/O externa. Os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 suportam a conexão de uma ou mais unidades de expansão de I/O externas opcionais instaladas no rack. Essas unidades possuem tecnologia hot-swap e podem instalar até placas 12 PCI-X ou 12 PCI Express. Além disso, a Unidade de expansão de I/O externa inclui fontes de alimentação e unidades de ventilador redundantes e com tecnologia hot-swap.
• Placas PCI. As placas PCI que suportam hot plug PCI podem ser conectadas no sistema através da tecnologia hot-swap colocando uma placa de expansão em um dos cassetes fornecidos antes da inserção em um compartimento PCI interno ou Unidade de expansão de I/O externa de um servidor SPARC Enterprise M4000, M5000, M8000 ou M9000. As placas PCI são desinstaladas do sistema usando o procedimento inverso. A capacidade de conectar placas PCI através da tecnologia hot-swap agrega flexibilidade e facilita a capacidade de manutenção.
• Mídia removível. Embora os dispositivos de disco e fita sejam diretamente integrados aos servidores SPARC Enterprise intermediários, uma placa de I/O base complementar fornece acesso a dispositivos internos em servidores SPARC Enterprise de high-end. Quando combinadas com softwares de espelhamento de disco, diversas unidades de disco rígido SCSI (SAS) internas instaladas por conexão serial e com tecnologia hot-swap fornecem suporte à redundância do disco de inicialização. Além disso, unidades de DVD-ROM e fita com tecnologia hot-swap nos servidores SPARC Enterprise M8000 e M9000 aumentam a flexibilidade desses sistemas.
Recursos específicos de expansão para servidores individuais são encontrados na Tabela 5 e na Tabela 6.
TABELA 5. RECURSOS DE EXPANSÃO DOS SERVIDORES SPARC ENTERPRISE M3000, M4000 E M5000
SERVIDOR SPARC ENTERPRISE M3000
SERVIDOR SPARC ENTERPRISE M4000
SERVIDOR SPARC ENTERPRISE M5000
PROCESSADORES
• 1
• SPARC64 VII de 2.52 GHz
• SPARC64 VII de 2.75 GHz
• SPARC64 VII+ de 2.86 GHz
• 2 ou 4
• SPARC64 VI de 2.15 GHz
• SPARC64 VII de 2.53 GHz
• SPARC64 VII+ de 2.66 GHz
• 2, 4, 6 ou 8
• SPARC64 VI de 2.15 GHz
• SPARC64 VII de 2.53 GHz
• SPARC64 VII+ de 2.66 GHz
MEMÓRIA
• Até 64 GB no máximo
• 8 compartimentos DIMM
• 256 GB no máximo
• 32 compartimentos DIMM
• 512 GB no máximo
• 64 compartimentos DIMM
GABINETE DE I/O EXTERNO
• Nenhuma
• Até 2 unidades
• Até 4 unidades
COMPARTIMENTOS DE I/O INTERNOS
• 4 PCI Express
• 4 PCI Express
• 1 PCI-X
• 8 PCI Express
• 2 PCI-X
UNIDADES DE DISCO RÍGIDO
• Até 4 unidades
• Até 2 unidades
• Até 4 unidades
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
19
TABELA 6. RECURSOS DE EXPANSÃO DOS SERVIDORES SPARC ENTERPRISE M8000 E M9000
SERVIDOR SPARC ENTERPRISE M8000
SERVIDOR SPARC ENTERPRISE M9000-32
SERVIDOR SPARC ENTERPRISE M9000-64
PROCESSADORES
• Até 16
• SPARC64 VI de 2.28 GHz ou 2.4 GHz
• SPARC64 VII de 2.88 GHz
• SPARC64 VII+ de 3.0 GHz
• Até 32
• SPARC64 VI de 2.28 GHz ou 2.4 GHz
• SPARC64 VII de 2.88 GHz
• SPARC64 VII+ de 3.0 GHz
• Até 64
• SPARC64 VI de 2.28 GHz ou 2.4 GHz
• SPARC64 VII de 2.88 GHz
• SPARC64 VII+ de 3.0 GHz
MEMÓRIA
• 1 TB no máximo
• 128 compartimentos DIMM
• 2 TB no máximo
• 256 compartimentos DIMM
• 4 TB no máximo
• 512 compartimentos DIMM
GABINETE DE I/O EXTERNO
• Até 8 unidades
• Até 16 unidades
• Até 16 unidades
COMPARTIMENTOS DE I/O INTERNOS
• 16 PCI Express
• 32 PCI Express
• 96 PCI Express
UNIDADES DE DISCO RÍGIDO
• Até 16 unidades
• Até 32 unidades
• Até 64 unidades
Recursos avançados de confiabilidade
Dentro dos servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000, redundâncias arquiteturais que aumentam inerentemente a confiabilidade são multiplicadas por avanços tecnológicos e recursos de detecção de erros. Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 apresentam as seguintes tecnologias importantes que podem ajudar a corrigir falhas e impedir que componentes marginais causem tempo de inatividade repetidamente.
Recuperação automática do sistema
Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 podem se recuperar rapidamente de diversos tipos de falhas, incluindo problemas sérios como a falha de uma CPU ou um ASIC crítico. Na verdade, nenhuma falha de um único componente de hardware impede que os servidores SPARC Enterprise M8000 e M9000 sejam inicializados. Quando uma falha ocorre, a ação corretiva específica tomada pelo sistema depende do componente e do tipo de erro. O sistema pode continuar a operar em um modo degradado ou pode iniciar a recuperação automática do sistema (ASR) disparando uma reinicialização imediata do sistema e a configuração automática de um componente com defeito. Os recursos de ASR ajudam a impedir que o hardware com defeito ou deixado de lado cause falhas repetidamente ou faça com que todo o sistema fique inoperante.
Redução do Número de Componentes e de sua Complexidade
A arquitetura básica dos servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 fornece a fundação para a obtenção de excelente confiabilidade do sistema. Esse projeto de servidor ostenta um número reduzido de componentes e menor complexidade que a geração anterior de servidores, resultando em classificações menores de Tempo médio entre falhas (MTBF). O número de ASICs incluídos no projeto desses sistemas é 60% menor que as gerações anteriores de sistemas. Por exemplo, os recursos de interconexão protegida por ECC combinavam endereço, dados e linhas de controle para todas as operações (ou seja, Leitura de memória, Gravação em memória, Cópia, Interrupções, Leitura de Periféricos), minimizando os sinais necessários e maximizando a largura de banda de endereço e dados.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
20
Processador SPARC64 VI e SPARC64 VII/VII+
Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 possuem processadores SPARC64 VI e SPARC64 VII/VII+. O projeto desses módulos de processador aumenta a confiabilidade do sistema fornecendo recursos aprimorados para evitar falhas e corrigir erros. Na verdade, boa parte da área no processador SPARC64 VI e SPARC64 VII/VII+ é dedicada à detecção de erros e correção de dados dentro da CPU. As unidades RAM do processador têm proteção ou duplicação de ECC e a maioria das travas e unidades executivas apresenta proteção de paridade. Em vez de forçar a perda de operação de todo o processador, um único núcleo defeituoso pode ser isolado e desativado. Além disso, as CPUs SPARC64 VI e SPARC64 VII/VII+ podem desativar de forma autônoma núcleos defeituosos sem a intervenção do processador de serviço. Os dados de erro gerados pelos processadores SPARC64 VI e SPARC64 VII/VII+ são enviados ao processador de serviços para oferecer suporte à manutenção preventiva, simplificando a identificação do local e tipo de uma falha, aumentando a facilidade de manutenção.
RAM do Processador
Os processadores SPARC64 VI e SPARC64 VII/VII+ oferecem recursos de confiabilidade que suportam altos níveis de integridade de dados. Quando os dados lidos pela memória possuem erros em múltiplos bits, uma marca especial identificando a origem do erro é gravada nos dados e a síndrome de ECC se torna um especial valor agregado, fornecendo informações importantes para a identificação da origem da falha. A Tabela 7 destaca os recursos de detecção e correção de erros dos processadores SPARC64 VI e SPARC64 VII/VII+.
TABELA 7. MÉTODOS DE DETECÇÃO E CORREÇÃO DE ERROS DO PROCESSADOR
TIPO
MÉTODO DE DETECÇÃO DE ERROS OU PROTEÇÃO
MÉTODO DE CORREÇÃO DE ERROS
CACHE DE INSTRUÇÕES L1 (DADOS)
Paridade
Invalidação e releitura
CACHE DE INSTRUÇÕES L1 (TAG)
Paridade + duplicação
Regravação de dados duplicados
CACHE DE DADOS L1 (DADOS)
Erro único Correção Erro duplo
Detecção (SECDED)
ECC Correção de erro de bit único usando ECC
CACHE DE DADOS L1 (TAG)
Paridade + duplicação
Regravação de dados duplicados
CACHE L2 (DADOS)
SECDED ECC
Correção de erro de bit único usando ECC
CACHE L2 (TAG)
SECDED ECC
Correção de erro de bit único usando ECC
INVALIDAÇÃO DE PARIDADE TLB DA INSTRUÇÃO
Invalidação de paridade TLB de dados
Recuperação de paridade do histórico da ramificação a partir de uma falha de predicação da ramificação
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
21
Como o processador SPARC64 VII/VII+ implementa um esquema de associação de conjuntos que divide o cache L1, cache L2 e TLB em unidades de caminho, uma degradação pode ser executada separadamente de maneira detalhada. As ocorrências de erro são calculadas para cada unidade. Quando o número de ocorrências de erro para um determinado intervalo de tempo excede o limite superior, a degradação é realizada e a unidade de caminho relevante não é usada subsequentemente. Para este tipo de evento, o hardware executa automaticamente a degradação e inicia as seguintes operações para garantir a continuidade da coerência dos dados armazenados em cache:
• Write-back para o cache L2. Executa write-back das linhas modificadas na unidade de caminho do cache L1D a serem degradadas.
• Write-back para a Memória. Executa write-back das linhas modificadas na unidade de caminho do cache L2 a serem degradadas.
A degradação de uma unidade de caminho é executada sem afetar de forma adversa os programas de software e a operação da aplicação fica livre de qualquer impacto, exceto por uma desaceleração da velocidade de processamento.
Registros Internos e Unidades de Execução
Para aumentar ainda mais a confiabilidade, os processadores SPARC64 VI e SPARC64 VII/VII+ também fornecem proteção contra erros registros e unidades de execução. Um resumo desses recursos se encontra na Tabela 8.
TABELA 8. MÉTODOS DE DETECÇÃO DE ERROS E PROTEÇÃO DE DADOS DE REGISTROS INTERNOS E UNIDADE DE EXECUÇÃO
TIPO
MÉTODO DE DETECÇÃO DE ERROS OU PROTEÇÃO
Registro de inteiro
SECDED ECC
Registro de ponto flutuante
Paridade
Registro PC, PSTATE
Paridade
Registro de entrada-saída de computação
Paridade
Unidade de execução de adição, subtração, divisão, mudança e gráfica
Predição de paridade
Unidade de execução de multiplicação
Predição de paridade + verificação do resíduo
Nova Tentativa de Instrução
Os processadores SPARC64 VI e SPARC64 VII/VII+ empregam um método de atualização síncrona e incluem proteção de ECC para registros de arquitetura de inteiros. Quando um erro ocorre, o circuito ECC corrige o erro. Os registros de ponto flutuante e outros registros são protegidos por bits de paridade. Além disso, o circuito de predição de paridade, circuito de verificação do resíduo e outros circuitos são implementados dentro de uma unidade de execução para propagar as informações de paridade para gerar resultados.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
22
No improvável evento de um erro de paridade ser detectado, as instruções que se encontram no ponto de execução são canceladas. Os resultados intermediários antes da confirmação podem ser descartados, e somente os resultados atualizados por instruções que foram concluídos sem encontrar qualquer erro permanecem nos recursos programáveis. Portanto, a destruição de recursos programáveis pode não somente ser impedida, como o hardware também pode executar uma nova tentativa de instrução após uma detecção de erro. Como as instruções paradas podem ser descartadas uma vez e, em seguida, tentadas novamente desde o início, existe uma possibilidade de recuperação no caso de um travamento.
Conforme mostrado na Figura 10, a nova tentativa de instrução é disparada por um erro e é iniciada automaticamente. Uma nova tentativa é executada instrução-por-instrução para aumentar a chance de execução normal. Quando a execução é concluída normalmente, o estado automaticamente retorna ao estado de execução normal. Durante este período, nenhuma intervenção de software é necessária, e se a nova tentativa de instrução for bem-sucedida, o erro não afeta o software. Uma nova tentativa de instrução é repetida até que o número de vezes de novas tentativas atinja o limite. Se o limite for excedido, o processador registra a fonte do erro e reporta o status ao sistema operacional.
Figura 10. Os processadores SPARC64 VI e SPARC64 VII implementam um processo de nova tentativa de instrução automatizada para aumentar a disponibilidade.
Vigilância, ECC estendido e Espelhamento de Memória
O subsistema de memória dos servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 inclui diversas tecnologias para aumentar a estabilidade2
. Os seguintes recursos trabalham para o diagnóstico precoce e o isolamento de falhas dentro do subsistema de memória para preservar a integridade do sistema e aumentar a disponibilidade da aplicação.
• Vigilância de memória. A Vigilância de memória executa periodicamente uma verificação para detectar erros de memória. Esta função impede a utilização de áreas defeituosas de memória, resultando em menos oportunidades de erros de sistema ou aplicação e maior confiabilidade do sistema.
• ECC estendido de memória. A função de ECC estendido de memória desses servidores suporta a correção de erros de bit único, facilitando o processamento contínuo apesar de eventos como erros de leitura que algumas vezes são causados por falhas no dispositivo de memória.
2 O Espelhamento de memória não é suportado no servidor SPARC Enterprise M3000
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
23
• Espelhamento de memória. Quando o modo de espelhamento de memória estiver habilitado em servidores SPARC Enterprise M4000, M5000, M8000 e M9000, o subsistema de memória duplica os dados em processo de gravação e compara os dados em processo de leitura com cada lado do espelho de memória. No caso de os erros ocorrerem no nível do barramento ou do DIMM, o processamento normal de dados continua através de outro barramento de memória e conjunto DIMM alternativo. Em servidores SPARC Enterprise M4000 e M5000, a memória é espelhada dentro do mesmo módulo de memória, usando o controle de endereço de memória comum (MAC) ASIC (Figura 11 e Figura 12).
Figura 11. A arquitetura de memória do servidor SPARC Enterprise M4000 espelha a memória dentro do mesmo módulo de memória.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
24
Figura 12. A arquitetura de memória do servidor SPARC Enterprise M5000 espelha a memória dentro do mesmo módulo de memória.
Em servidores SPARC Enterprise M8000 e M9000, a memória é espelhada através de ASICs de MAC adjacentes para aumentar a confiabilidade (Figura 13). Entretanto, a configuração de Quad-XSBs em placas de sistema de servidor de high-end SPARC Enterprise impede o uso de espelhamento de memória desde que cada Quad-XSB contenha somente um MAC.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
25
Figura 13. A arquitetura de memória do servidor SPARC Enterprise M8000 e M9000 espelha a memória de ASICs de MAC adjacentes
Recursos de detecção de erro adicional, diagnóstico e recuperação
Os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 incluem recursos para detecção, diagnóstico e recuperação de erros por toda a arquitetura do sistema. A lista a seguir destaca os recursos não somente para identificar problemas, mas para trabalhar para minimizar as consequências e contribuir com a rápida recuperação da operação do sistema.
• Proteção de ECC completa. Os servidores SPARC Enterprise M-Series rotineiramente armazenam e movem quantidades significativas de dados. Assim, esses servidores fornecem detecção de erros completa e correção de caminhos de dados dentro do sistema, incluindo os processadores SPARC64 VI e SPARC VII/VII+, a memória principal e caminhos de dados nas interconexões do sistema.
• Isolamento de falhas de última geração. Enquanto as condições de erro exigem que as gerações anteriores dos servidores corporativos desativem os dispositivos de hardware por completo, os servidores SPARC Enterprise M-Series isolam os erros dentro dos limites dos componentes e desativam somente os chips relevantes. O isolamento de erros até o nível do chip melhora a estabilidade e fornece disponibilidade contínua de capacidade máxima de computação. Este recurso se aplica a CPUs, controladores de acesso de memória, ASICs de crossbar, controladores de sistema e ASICs de I/O.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
26
• Monitoramento ambiental. O monitoramento ambiental fornece um registro histórico de condições pertinentes do ambiente e de erros.
• Vigilância do host. O recurso de vigilância do host dos servidores SPARC Enterprise M4000, M5000, M8000 e M9000 verifica periodicamente a operação do software, incluindo o domínio do sistema operacional. Este recurso também usa o firmware do XSCF para disparar a notificação de erro e as funções de recuperação.
• Desalocação dinâmica de recursos de CPU. Os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 suportam a desalocação dinâmica de recursos de CPU incluindo a detecção, isolamento e recuperação de falhas no processador. Este recurso realoca dinamicamente recursos de CPU em um sistema operacional usando a Reconfiguração dinâmica sem interrupção das aplicações que estão sendo executadas.
• Verificações de status do componente. São executadas verificações periódicas para determinar o status de diversos componentes do sistema e detectar sinais de uma falha iminente. Mecanismos de recuperação são disparados para impedir a falha do sistema e da aplicação.
• Métodos de identificação de erros. O registro de erros, alertas com múltiplas etapas, informação de identificação eletrônica de FRU e indicadores LED de falha do sistema contribuem para a resolução rápida de problemas.
• Autoteste de inicialização. No controle do usuário, um autoteste de inicialização (POST) é executado para testar uma ampla gama de componentes do sistema. Embora ele não tenha a intenção de ser executado como um diagnóstico abrangente, o POST pode estabelecer rapidamente que nenhum problema grave existe com o sistema. O POST comunica o status do sistema através do Controlador do sistema e da tela do painel frontal.
• Conjunto de testes de validação da Sun. O Conjunto de testes de validação da Sun (SunVTS) fornece recursos robustos de diagnóstico on-line para servidores SPARC Enterprise. A principal meta do software do SunVTS é criar um ambiente onde os sistemas Sun sejam testados por completo para oferecer suporte à operação correta ou encontrar problemas enganosos.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
27
Maximização da estabilidade do serviço de TI
Além de fornecer recursos de hardware que ajudam as plataformas a resistir a falhas sem a implicação de tempo de inatividade, a abordagem da Oracle para a disponibilidade também se concentra na criação de tecnologias de software que ajudam a impedir, prever e rapidamente recuperar de falhas. Os recursos de auto-correção e diagnósticos do Oracle Solaris e os mecanismos de failover oferecidos pelo Oracle Solaris Cluster podem ajudar a melhorar ainda mais a estabilidade dos serviços de TI que são executados nos servidores SPARC Enterprise M-Series.
Oracle® Solaris
Com mais de 20 anos de investimento em engenharia, o Oracle Solaris é um dos mais confiáveis sistemas operacionais disponíveis. Na verdade, diversas organizações podem indicar sistemas que são executados no Oracle Solaris que estão em operação contínua por meses ou até mesmo anos sem uma reinicialização. O Oracle Solaris oferece diversas tecnologias avançadas para ajudar a maximizar a disponibilidade dos sistemas, incluindo o seguinte.
• O software Oracle Solaris Predictive Self Healing é um recurso inovador do Oracle Solaris que monitora e gerencia proativamente os componentes do sistema, facilitando recursos como diagnósticos automáticos, isolamento e recuperação de diversas falhas de hardware e aplicações.
• O Oracle Solaris Containers suporta a virtualização de recursos dentro de uma única imagem do Oracle Solaris, ajudando a maximizar a estabilidade de ambientes consolidados oferecendo suporte ao isolamento seguro de cargas de trabalho de softwares independentes.
• O Oracle Solaris Live Upgrade aumenta a eficiência dos procedimentos de manutenção do software, ajudando a minimizar o tempo de inatividade planejado para as tarefas de atualização e instalação do sistema.
• A tecnologia de rede do Oracle Solaris automatiza a detecção e correção de erros de conectividade de rede e a distribuição de carga do tráfego de IP.
• Os Recursos avançados de segurança do Oracle Solaris, incluindo recursos de autenticação, integridade de dados, privacidade de dados e sign-on único, ajudam a impedir fraudes e espionagem de dados comprometedores ou transações associadas.
Oracle Solaris Predictive Self Healing
Quando ocorrem falhas em sistemas tradicionais, os administradores normalmente tentam compreender o problema observando as mensagens de erro e os arquivos de log do sistema e aplicações. Infelizmente, essas mensagens de erro pré-programadas tendem a mostrar somente os sintomas e não necessariamente relevam o problema subjacente. Os administradores são quase sempre desafiados a compreender e interpretar um fluxo de erros. O Oracle Solaris Predictive Self Healing é um recurso inovador no Oracle Solaris 10 que pode diagnosticar, isolar e recuperar automaticamente de diversas falhas de hardware e aplicações, ajudando aplicações críticas para os negócios e serviços de sistema essenciais a continuarem a operar sem interrupções. O Oracle Solaris Fault Manager e o Oracle Solaris Service Manager são os dois componentes principais do Oracle Solaris Predictive Self-Healing.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
28
Oracle Solaris Fault Manager
O Oracle Solaris Fault Manager é um recurso do Oracle Solaris Predictive Self Healing que aumenta a confiabilidade do sistema diagnosticando falhas automaticamente no sistema e iniciando ações de pré-correção para impedir a interrupção dos serviços. Este software ajuda a aumentar a disponibilidade configurando os componentes de problema de um sistema antes de a falha ocorrer — e, no caso de uma falha, este recurso inicia a recuperação automática e reinicialização da aplicação. O mecanismo de diagnóstico do Oracle Solaris produz um diagnóstico de falhas uma vez que padrões discerníveis são observados a partir de um fluxo de erros de entrada. Após o diagnóstico, o Oracle Solaris Fault Manager fornece informações sobre a falha aos agentes que sabem como reagir a falhas específicas. Por exemplo, um agente designado para reagir a um erro de memória pode determinar os endereços de memória afetados por uma determinada falha de chip e remover os locais afetados do conjunto de memória disponível.
Oracle Solaris Service Manager
O Oracle Solaris Service Manager converte o conjunto principal de serviços empacotados com o sistema operacional para objetos de primeira classe que os administradores podem manipular com um conjunto consistente de comandos de administração. Usando o Oracle Solaris Service Manager, os administradores podem tomar ações em relação aos serviços incluindo o início, parada, reinício, ativação, desativação, status de exibição e instantâneo. Os instantâneos de serviços salvam a configuração completa de um serviço, fornecendo aos administradores uma forma de reverter qualquer alteração incorreta aplicadas a um serviço. Os instantâneos são obtidos automaticamente sempre que um serviço é iniciado para ajudar a reduzir o risco protegendo contra erros falsos. O Oracle Solaris Service Manager é integrado ao Oracle Solaris Fault Manager. Consequentemente, quando é detectado que uma falha de baixo nível está impactando um componente de alto nível de um serviço em execução, o Oracle Solaris Fault Manager pode direcionar o Oracle Solaris Service Manager a tomar a ação apropriada.
Tecnologia Oracle Solaris Containers
O isolamento correto do recurso da aplicação pode ser essencial para obter os altos níveis de disponibilidade para cargas de trabalho consolidadas. O Oracle Solaris Containers fornece a capacidade de gerenciamento de recursos detalhada e permite a virtualização de uma imagem do Oracle Solaris. Cada Oracle Solaris Container é atribuído a um sistema de arquivos raiz exclusivo, um conjunto compartilhado de executáveis e bibliotecas do sistema, e um conjunto de recursos de computação conforme atribuído pelo administrador principal. O Oracle Solaris Containers inicializa e desliga como qualquer outra instância do Oracle Solaris, e reinicializa em apenas segundos, se necessário.
A utilização do Oracle Solaris Containers para particionar recursos para tarefas particulares pode refinar ainda mais um Domínio dinâmico nos servidores SPARC Enterprise M-Series. O Oracle Solaris Containers fornece um ambiente virtualizado seguro para a execução da aplicação enquanto também oferece aos administradores flexibilidade quase ilimitada para atribuir e isolar recursos a determinados contêineres. Na verdade, o Oracle Solaris Containers cria um poderoso modelo de segurança melhorando a capacidade de uma organização de conter brechas de segurança, limitar a eficiência de ataques e minimizar a instalação de softwares enganadores como Cavalos de Troia. O Oracle Solaris Containers também pode ajudar a diminuir os requisitos de manutenção e administração em um ambiente consolidado eduzindo o número de imagens do sistema operacional sem dar a cada aplicação sua própria instância do Oracle Solaris.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
29
Oracle Solaris Live Upgrade
Atualizações tradicionais do sistema operacional são uma das tarefas que mais consumem tempo e mais suscetíveis a erros enfrentadas pelos administradores de sistema. Muitos sistemas de data center ou de missão crítica não podem arcar com as consequências de um tempo de inatividade não planejado por um dia ou até mesmo uma hora para a execução de atualizações de software, patches e de sistema operacional juntamente com os testes necessários. O Oracle Solaris Live Upgrade proporciona uma maior disponibilidade fornecendo um mecanismo para atualizar e gerenciar diversas instâncias em disco do Oracle Solaris, permitindo que as atualizações do sistema operacional ocorram enquanto o sistema continua em funcionamento. Na verdade, o Oracle Solaris Live Upgrade pode ajudar a reduzir o tempo de inatividade planejado necessário para uma atualização do sistema operacional para o tempo necessário para uma simples reinicialização.
Redundância de rede e Multicaminho de IP da rede
Além do tradicional suporte às diversas interfaces de rede conectadas a diferentes sub-redes, o Oracle Solaris também fornece interfaces de rede redundantes que são conectadas a uma única sub-rede. O Multicaminho de IP fornece failover e agregação de links IP. Diversos recursos principais de rede redundante que funcionam para melhorar a disponibilidade dos servidores Sun se encontram abaixo.
• A Detecção de falhas fornece a capacidade de detectar quando um adaptador de rede falha e muda automaticamente (failover) o acesso de rede para um adaptador de rede alternativo.
• A Detecção de reparo detecta o reparo de um adaptador de rede anteriormente com falha e retorna automaticamente (fail back) o acesso de rede para esta interface.
• A Distribuição da carga de saída distribui os pacotes de rede de saída entre diversos adaptadores de rede para obter um maior throughput. A distribuição de carga ocorre somente quando o tráfego de rede está fluindo para diversos locais usando várias conexões.
Oracle Solaris Security
O Oracle Solaris oferece um enorme conjunto de recursos de segurança incorporados. Os seguintes recursos do Oracle Solaris trabalha para ajudar as organizações a proteger as cargas de trabalho de transações com menos esforço e sem custo adicional.
• As Extensões confiáveis do Solaris fornecem segurança rotulada com imposição obrigatória de controle de acesso para o isolamento de dados e aplicações. O acesso a dados restrito oferecido pelas Extensões confiáveis do Solaris minimizam drasticamente o potencial de brechas de segurança e o uso inapropriado de dados corporativos confidenciais.
• O Gerenciamento de direitos de usuário do Solaris oferece suporte ao controle acesso com base em funções sobre os direitos de acesso que tanto usuários como aplicações podem exercer incorporando tecnologia do comprovado SO Solaris. O Gerenciamento de direitos de usuário do Solaris ajuda as organizações a limitarem as brechas intencionais e não intencionais de segurança fornecendo um controle mais detalhado de recursos de superusuário.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
30
• O Gerenciamento de direitos de processos do Solaris restringe os privilégios pré-atribuindo direitos a processos de usuário, limitando significativamente os danos que podem ser obtidos se o processo estiver comprometido por um ataque. O Gerenciamento de direitos de processos do Solaris reduz os riscos à segurança concedendo às aplicações somente os recursos mínimos necessários para executar as tarefas exigidas.
Oracle Solaris Cluster
Para oferecer tempo de atividade excepcional para sistemas críticos, as empresas implantam um número cada vez maior de ambientes de cluster. Projetadas para alta disponibilidade, bem como facilidade de gerenciamento, as implantações de Oracle Solaris Cluster fornecem os seguintes benefícios em soluções com um único servidor.
• Maior disponibilidade de serviços. Os recursos redundantes no cluster, associados ao uso de mecanismos de failover e serviços escalonáveis, podem ajudar a aumentar a disponibilidade de serviço da aplicação.
• Maior escalabilidade. Grandes servidores SMP podem ser agrupados em um cluster, permitindo que a capacidade geral seja ampliada através da adição de recursos aos servidores individuais (escalabilidade vertical) ou através do aumento do número de servidores participantes no cluster (escalabilidade horizontal).
• Melhor utilização de recursos. O equilíbrio de carga e gerenciamento de recursos em todos os clusters promove o compartilhamento de recursos de sistema por todos os serviços de aplicação e permite que os recursos de sistema sejam reatribuídos a outros serviços em vez de ficarem ociosos.
• Maior facilidade de gerenciamento. Um ambiente simples de gerenciamento para o cluster oferece a oportunidade de gerenciar componentes, serviços e recursos de forma holística para ajudar a melhorar a eficiência e reduzir os custos.
• Menor Custo total de propriedade. A estrutura do Oracle Solaris Cluster pode ajudar a reduzir o Custo total de propriedade através da simplificação da administração. Recursos de vários nós podem ser agrupados e administrados como um único sistema. Os administradores podem acessar as ferramentas de gerenciamento do sistema e os comandos do Oracle Solaris a partir de qualquer sistema no cluster. Os administradores podem adicionar ou remover nós enquanto estiverem on-line e podem associar servidores dentro de clusters para atender a necessidades específicas.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
31
Estrutura do Oracle Solaris Cluster
A partir de uma perspectiva física, uma implantação do Oracle Solaris Cluster é composta de dois ou mais servidores ou domínios que funcionam juntos como uma única entidade para fornecer aplicações, recursos de sistema, e dados a usuários de forma cooperativa. A configuração de cada servidor geralmente inclui algum nível de redundância de hardware. Além disso, o armazenamento é hospedado em sistemas de disco redundantes e altamente disponíveis e espelhados, oferecendo suporte ao acesso a dados no caso de uma interrupção do sistema e um disco único ou subsistema de armazenamento. As conexões redundantes são fornecidas para os sistemas de disco de forma que os dados não sejam isolados no caso de uma falha do servidor, controlador ou cabo. Um sistema de interconexão privado, redundante e de alta velocidade fornece acesso a recursos através do conjunto de servidores. As conexões redundantes à rede pública também fornecem cada nó com diversos caminhos para acesso a sistemas externos, ajudando a garantir o acesso contínuo no caso de uma falha na conexão de rede ou no nó.
Essencial ao projeto das implementações do Oracle Solaris Cluster é o fato de que nenhuma falha única no hardware, software, interconexão ou rede pode fazer com que o cluster falhe. As soluções do Oracle Solaris Cluster impedem a perda de serviço através da redundância de hardware, detecção de falhas de hardware e software, recuperação automática de serviços e failover de aplicações. O software Oracle Solaris Cluster também fornece uma exibição de gerenciamento exclusiva para todos os serviços no cluster. Todo o cluster é exibido como um único servidor Sun, reduzindo o risco de erros.
A partir de uma perspectiva lógica, uma implantação do Oracle Solaris Cluster é composta de um conjunto de domínios; onde cada domínio executa de forma independente uma cópia do Oracle Solaris e se comunica através de uma interconexão particular. A utilização de recursos de envio de mensagens de alta velocidade para construir um cluster quase duplo e ainda assim altamente disponível elimina a necessidade de domínios para compartilhar memória. Utilizando algorítimos distribuídos, o cluster monitora continuamente a integridade de todos os membros. Domínios com falha são impedidos ativamente de participar no cluster para impedir qualquer possibilidade de corrupção dos dados.
Software Oracle Solaris Cluster Software
Disponível para Oracle Solaris 8, 9 e 10, o software Oracle Solaris Cluster amplia a capacidade de o sistema operacional fornecer disponibilidade aprimorada para as aplicações hospedadas. O principais serviços do Oracle Solaris, como dispositivos, sistemas de arquivo e redes, funcionam de maneira praticamente perfeita através de um cluster rigidamente associado. Mantendo compatibilidade total com o Oracle Solaris para as aplicações existentes, o software Oracle Solaris Cluster gerencia de forma transparente o acesso compartilhado a seu serviço de arquivos global, serviço de rede global e dispositivos globais. A disponibilidade aprimorada dos principais serviços como serviço de arquivo e de rede permite que as aplicações existentes desenvolvidas para Oracle Solaris se beneficiem da maior disponibilidade, retenção de falhas mais localizada e failover mais rápido.
O Oracle Solaris Cluster suporta tanto serviços escalonáveis como altamente disponíveis (failover). Os serviços escalonáveis oferecem suporte a múltiplos nós em um cluster para lidar com números cada vez maiores de usuários simultâneos, quando os serviços de failover podem ajudar a aumentar a disponibilidade dos serviços de aplicação. O software Oracle Solaris Cluster inclui os seguintes recursos principais.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
32
• Monitoramento da alta disponibilidade. A estrutura do Oracle Solaris Cluster fornece monitoramento abrangente de processos de aplicação, integridade de caminho de disco e disponibilidade de rede para detectar falhas rapidamente e facilitar a migração para outro nó no cluster. Um conjunto distribuído de agentes trocam mensagens sobre uma interconexão de clusters, impondo uma exibição consistente de associação, gerando reconfiguração sincronizada, lidando com o particionamento de clusters e ajudando a manter total conectividade entre todos os membros do cluster.
• Virtualização. O software Oracle Solaris Cluster fornece suporte ampliado para o software de virtualização Solaris Containers. Esses recursos de virtualização permitem que aplicações escalonáveis e de failover e os agentes associados do Oracle Solaris Cluster sejam executados sem modificação dentro do Oracle Solaris Containers.
• Dispositivos, arquivos e rede global. O Oracle Solaris Cluster suporta a utilização de dispositivos, arquivos e interfaces de rede compartilhadas globalmente como recursos locais. Este recurso permite que os nós de cluster acessem e utilizem dispositivos que não são conectados fisicamente, mas são acoplados a outro nó dentro do cluster. Esses recursos criam uma escalabilidade de armazenamento e rede praticamente perfeita, bem como uma melhor disponibilidade de recursos e administração simplificada.
• Gerenciamento de dados escalonáveis. Com a escalabilidade praticamente ilimitada do Oracle Solaris Zetabyte File System (ZFS), o software Oracle Solaris Cluster oferece uma solução de sistema de arquivos com excepcional disponibilidade, integridade de dados e flexibilidade para crescimento.
• Monitoramento de aplicações. O Oracle Solaris Cluster inclui diversos agentes escalonáveis e de failover para o monitoramento da disponibilidade contínua de diversas aplicações da Sun e terceirizadas.
• Recuperação de desastres em múltiplos locais. O Oracle Solaris Cluster Geographic Edition gerencia a disponibilidade de serviços e dados de aplicação através de distâncias geograficamente ilimitadas.
• Grupos de proteção. O software Oracle Solaris Cluster permite que um administrador defina grupos de recursos que devem ser gerenciados juntos, facilitando o perfeito failover de aplicações e dados relacionados.
• Facilidade de uso. Uma interface de linha de comando orientada a objetos e um assistente de configuração com base em navegador facilitam a utilização e simplificam a configuração de novos serviços de dados.
Tecnologias de Interconexão
Os clusters dependem de interconexões para movimentar informações entre nós. Deve-se ter cuidado para evitar gargalos de interconexões que podem funcionar como obstáculos para atingir o potencial de projetos de sistema que, de outro modo, teriam alto desempenho. A interconexão de clusters empregada nos sistemas Oracle Solaris Cluster é uma configuração física de redes independentes ou interconexões de sistemas que transferem comunicações privadas de clusters e serviços de dados entre nós de cluster. O software Oracle Solaris Cluster utiliza a tecnologia de interconexão para comunicações entre nós, mensagens no nível de aplicações e transferências de dados e metadados para recursos de serviço de arquivos global e serviços de rede global.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
33
Todos os nós são conectados por uma interconexão de cluster através de pelo menos dois links ou caminhos independentes ou fisicamente redundantes, eliminando pontos de falha únicos. Embora sejam necessários dois links para redundância, o software Oracle Solaris Cluster permite que até seis sejam usados para espalhar o tráfego, evitando gargalos e melhorando a redundância e a escalabilidade. Consequentemente, a interconexão de cluster permite a utilização completa dos componentes de alto desempenho nos sistemas de cluster. Uma interconexão de cluster Gigabit Ethernet fornece uma opção de baixo custo que oferece desempenho razoável durante failover e oferece uso efetivo dos dispositivos globais do Oracle Solaris Cluster, rede global e sistema de arquivos global. Para as implementações do Oracle Solaris Cluster que exigem uma maior largura de banda de interconexão, interconexões InfiniBand também são suportadas.
Utilização de agentes para serviços de failover ou escalonáveis
Os agentes são programas de software que permitem que as aplicações tirem proveito do Oracle Solaris Clusters. Compostos de diversos métodos, esses programas de software facilitam a inicialização, interrupção e monitoramento de aplicações em nós de cluster. Associados a softwares de estrutura de cluster e discos multi-host, os agentes ajudam a aumentar a disponibilidade e escalabilidade de aplicações. Os agentes ajudam a impedir interrupções significativas de aplicações após qualquer falha dentro do cluster.
Agentes de Failover
Os sistemas Oracle Solaris Cluster suportam agentes de failover para aplicações e serviços. Quando ocorre uma falha, uma aplicação em execução é reinicializada no mesmo nó ou migrada para outro nó no cluster sem a intervenção do usuário, dependendo da configuração da aplicação. Para realizar esta tarefa, os serviços de falha migram e reconfiguram nomes de host lógicos (endereços IP) entre os nós de cluster. Os endereços IP são configurados automaticamente até o nó original e o nó de reposição.
Agentes Escalonáveis
Os sistemas Oracle Solaris Cluster fornecem agentes para suportar a execução simultânea de instâncias de aplicações em múltiplos nós de cluster. Os arquivos que contêm recursos de aplicação e de rede (endereços compartilhados) dos quais dependem os agentes escalonáveis são usados para guardar as informações críticas necessárias para migrar serviços de um nó de cluster para outro.
Todos os nós que hospedam um agente escalonável usam o mesmo endereço compartilhado para hospedar o serviço. As solicitações de serviço entram no cluster através de uma única interface global e são distribuídas a nós de cluster com base em uma política de equilíbrio de carga. Se o nó que hospeda a interface global falha, ocorre o failover da interface global para outro nó.
Agentes Personalizados
Além de agentes da Oracle e fornecedores de software terceirizados, novos agentes podem ser criados sob medida para permitir que outras aplicações tirem proveito de serviços de failover ou serviços escalonáveis no software Oracle Solaris Cluster. Um Kit de desenvolvimento de agentes enviado junto fornece tudo o que os desenvolvedores precisam para tirar total proveito dos serviços do Oracle Solaris Cluster. Como alternativa, as organizações podem tirar proveito da experiência da Sun e simplificar os esforços de desenvolvimento contratando os Serviços da Sun para construir agentes personalizados.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
34
Serviços de Cluster Remotos
O uso local de clusters fornece um nível sólido de disponibilidade contínua de serviço no caso de aplicação, sistema operacional ou falha de hardware em um único data center. Entretanto, algumas empresas exigem proteção adicional contra desastres como a perda de um prédio ou campus inteiro. Nesses casos, faz sentido distribuir os nós de cluster entre diversos locais geograficamente distintos ou fornecer a capacidade de failover para um cluster secundário em um local remoto. O Oracle Solaris Cluster oferece as seguintes opções para serviços de cluster remotos:
Campus Clustering
O Campus Clustering essencialmente amplia a distância entre os componentes de cluster, permitindo que um sistema de cluster se estenda por várias salas ou prédios em um campus. O Campus Clustering suporta até 20 km de separação entre os componentes, como nós e armazenamento compartilhado. No caso de um desastre como enchente, incêndio ou queda de energia do prédio, os nós sobreviventes podem suportar o serviço de um nó com defeito. Essa solução oferece alguma tolerância no nível local, sujeita a quorum. Entretanto, as curtas distâncias físicas do Campus Clustering limitam a capacidade de sobrevivência do cluster e de seus serviços no caso de desastres maiores, como terremotos ou quedas de energia da rede elétrica.
Metro Clustering
Para maior disponibilidade entre uma distância maior, os nós de cluster podem ser separados por até 200 km usando o software Solaris Cluster e a tecnologia de multiplexação de divisão de ondas densa (DWDM) para fornecer continuidade de serviços da aplicação no caso de uma falha catastrófica. Entretanto, uma única solução de cluster suportada entre uma distância limitada ainda pode ser afetada por um único desastre. Por exemplo, um evento semelhante à queda de energia da rede elétrica da Costa Leste dos EUA em 2003 pode impactar locais de metro clustering sendo executados de Nova York a Boston. Por fim, devido ao fato de os sistemas de armazenamento serem compartilhados pelo cluster, o desempenho em disco é limitado pela latência dos links de conexão.
Para organizações que precisam sobreviver rapidamente a desastres que se espalham por uma ampla área, o Solaris Cluster Geographic Edition oferece uma solução de recuperação de desastres de múltiplos locais que gerencia a disponibilidade de serviços e dados de aplicação por distâncias geograficamente ilimitadas. A Sun Cluster Geographic Edition também é destinada a organizações que trabalham ininterruptamente por todo o mundo e que exigem que um cluster local replique a mesma configuração e dados que outro cluster que se encontra em algum outro lugar do mundo. No caso de um Solaris Cluster principal ficar inoperante, o Sun Cluster Geographic Edition ajuda um administrador a inicializar rapidamente os serviços de negócios com dados replicados no Oracle Solaris Cluster secundário.
Personalização das Configurações
As organizações podem ajustar a configuração de domínios dentro de servidores SPARC Enterprise M-Series para atender a metas específicas de disponibilidade. Os exemplos a seguir ilustram a flexibilidade para usar um conjunto de hardware para criar soluções com diferentes características de disponibilidade.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
35
Um servidor SPARC Enterprise M8000 com quatro CMUs e quatro IOUs é usado para ambos os exemplos.
• Cada um dos quatro CMUs do SPARC Enterprise M8000 (CMU0, CMU1, CMU2 e CMU3) contém as seguintes quantidades de CPU e memória:
• Quatro processadores SPARC64 VII de 2.88 GHz
• 32 x DIMMs de 2 GB
• Cada um dos quatro IOUs do SPARC Enterprise M8000 (IOU0, IOU1, IOU2 e IOU3) contém os seguintes dispositivos de I/O:
• Quatro Discos rígidos de 300 GB
• Duas placas de I/O de base (Compartimentos 0, 4)
• Três placas FC de 8 Gb (Compartimentos 1, 3, 6)
• Três placas Ethernet Quad de 1 Gb (Compartimentos 2, 5, 7)
Cada exemplo divide o servidor SPARC Enterprise M8000 em quatro domínios. Além disso, cada domínio suporta uma única aplicação corporativa e inclui quatro CPUs e 64 GB de memória. Ambas as configurações também podem tirar proveito do multicaminho de rede IP (IPMP) e I/O multiplexada (MPxIO) para criar caminhos de I/O alternativos que pode ser utilizados no caso de uma rota de I/O principal falhar. A principal diferença entre os dois exemplos de configuração está no fato de que as CMUs e as IOUs são configuradas como Uni-XSBs para o primeiro exemplo e Quad-XSBs para o segundo exemplo.
Exemplo Um — Priorização do Isolamento da Falha de Hardware
Neste exemplo, cada CMU é colocada em modo de Uni-XSB e a cada domínio são atribuídos todos os recursos de uma CMU e uma IOU (Tabela 9). A configuração resultante maximiza o isolamento de falhas. Como cada par de CMU e IOU suporta somente um domínio, uma falha de CMU ou IOU somente impacta a aplicação configurada para executar neste único domínio. Outros domínios (que utilizam CMUs e IOUs separadas) continuam a ser executados normalmente. Se o componente com defeito for o SC ou ASIC MAC, o domínio não pode ser reinicializado e os aplicações no domínio com defeito permanecem indisponíveis. Entretanto, o software Oracle Solaris Cluster pode ser utilizado para permitir que outro domínio ou um servidor distinto retome o processamento da aplicação para o domínio com defeito.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
36
TABELA 9. EXEMPLO DE CADA DOMÍNIO POSSUINDO TODOS OS RECURSOS DE UM ÚNICO PAR CMU E IOU
DOMÍNIO
UNI-XSB ATRIBUÍDA
DESCRIÇÃO
Domínio 1
XSB00-0
A XSB00-0 contém todas as CPUs e memória de CMU0 e todas as I/O e discos de IOU0.
Domínio 2
XSB01-0
A XSB01-0 contém todas as CPUs e memória de CMU1 e todas as I/O e discos de IOU1.
Domínio 3
XSB02-0
A XSB02-0 contém todas as CPUs e memória de CMU2 e todas as I/O e discos de IOU2.
Domínio 4
XSB03-0
A XSB03-0 contém todas as CPUs e memória de CMU3 e todas as I/O e discos de IOU3.
Exemplo Dois — Simplificação de Alterações no Equilíbrio de Carga e Alocação de Recursos
Para este exemplo, cada CMU é colocada em modo Quad-XSB. Cada domínio é composto de recursos dentro de uma Quad-XSB a partir de cada par CMU-IOU (Tabela 10). Usando uma terminologia de configuração de armazenamento, isso é semelhante à criação de umadivisãopor todos os hardwares disponíveis — cada domínio depende de uma parte dos recursos de todos os quatro pares CMU-IOU.
TABELA 10. OS RECURSOS DE CADA DOMÍNIO SÃO OBTIDOS DE DIVERSOS CONJUNTOS DE PLACA DE CMU E IOU.
DOMÍNIO
UNI-XSBS ATRIBUÍDAS
DESCRIÇÃO
Domínio 1
XSB00-0, XSB01-1, XSB02-2, XSB03-3
O Domínio 1 contém recursos de cada CMU e IOU
Domínio 2
XSB01-0, XSB02-1, XSB03-2, XSB00-3
O Domínio 2 contém recursos de cada CMU e IOU
Domínio 3
XSB02-0, XSB03-1, XSB00-2, XSB01-3
O Domínio 3 contém recursos de cada CMU e IOU
Domínio 4
XSB03-0, XSB00-1, XSB01-2, XSB02-3
O Domínio 4 contém recursos de cada CMU e IOU
Em posição ao primeiro exemplo, uma falha de hardware em qualquer CMU ou IOU impacta todos os domínios. Entretanto, a vantagem desta configuração é a capacidade de mover rapidamente uma única CPU, memória ou dispositivo de I/O de um domínio para outro, simplificando as alterações no equilíbrio de carga e alocação de recursos. Na verdade, as operações de reconfiguração podem ser concluídas enquanto as aplicações continuam a serem processadas. A recuperação de uma falha do SC ou ASIC MAC exige tempo de inatividade para substituição do hardware ou o uso do Oracle Solaris Cluster para habilitar outro servidor para assumir a carga de trabalho de todos os outros quatro domínios.
Aprimoramento dos processos e eficiência operacional
O estabelecimento de processos que ajudam a reduzir a quantidade de erros administrativos e minimizar a oportunidade de ignorar possíveis falhas do sistema é essencial para maximizar o tempo de atividade. As ferramentas de gerenciamento e monitoramento do sistema para os servidores SPARC Enterprise M-Series podem ajudar as organizações a automatizarem e otimizarem os processos de TI. Os abrangentes recursos incorporados de gerenciamento e monitoramento dos servidores SPARC Enterprise M- Series e ferramentas como o Oracle Enterprise Manager Ops Center e o Sun Management Center ajudam as organizações a simplificarem processos, gerando níveis mais altos de disponibilidade para os serviços de TI. A utilização dessas ferramentas também para melhorar processos também pode ajudar a aumentar a eficiência operacional, reduzindo os custos administrativos em geral.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
37
Monitoramento e gerenciamento remoto
O fornecimento de administração de sistemas local e prático não é mais realístico para a maioria das empresas. Com a necessidade de suportar operações ininterruptas, hot sites para recuperação de desastres e data centers geograficamente dispersos, o gerenciamento remoto é essencial para melhorar a eficiência operacional. Os servidores SPARC Enterprise M-Series fornecem poderosos recursos eXtended System Control (XSCF) para executar remotamente e controlar praticamente qualquer tarefa administrativa que não envolva acesso físico ao hardware.
O XSCF é composto de um processador dedicado que executa de forma independente do servidor principal e utiliza o software XSCF Control Package. O XSCF se comunica com o servidor usando o Domain to Service Processor Communication Protocol (DSCP). Este protocolo é executado em um link de comunicação privada com base em TCP/IP ou PPP entre o processador de serviços e cada domínio. Embora a alimentação de entrada seja fornecida ao servidor, o XSCF monitora constantemente o sistema, mesmo se todos os domínios estiverem inativos. O XSCF monitora regularmente os sensores ambientais, fornece avisos avançados de possíveis condições de erro, e executa procedimentos de manutenção proativa do sistema conforme necessário. Por exemplo, o XSCF pode iniciar um desligamento do servidor em reação a condições de temperatura que poderiam gerar danos físicos ao sistema.
O XSCF Control Package que está sendo executado no processador de serviços ajuda os administradores a controlar e monitorar domínios remotamente, bem como a própria plataforma. Usando uma conexão de rede ou serial com o XSCF, os operadores podem administrar o servidor de forma efetiva a partir de qualquer lugar na rede. As conexões remotas para o processador de serviços são executadas separadamente do sistema operacional e fornecem controle total e autoridade de um console do sistema.
XSCF Control Package
O XSCF Control Package ajuda os usuários a controlar e monitorar as plataformas de servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000 e Domínios dinâmicos individuais, de forma rápida e eficiente. Uma interface de linha de comando (CLI) e interface de usuário de navegador Web fornecida pelo XSCF Control Package fornece aos administradores e operadores acesso à funcionalidade do controle do sistema. Contas protegidas por senha com recursos específicos de administração também fornecem segurança do sistema para consoles de domínio. A comunicação ocorre entre o XSCF e domínios individuais que usam uma conexão criptografada baseada em Secure Shell (SSH) e Secure Socket Layer (SSL), oferecendo suporte à execução remota e segura dos comandos do XSCF Control Package.
O XSCF Control Package contribui para a confiabilidade, disponibilidade e facilidade de manutenção do sistema, oferecendo as seguintes funções principais:
• Os comandos da Reconfiguração dinâmica facilitam a execução de tarefas para acoplar ou desacoplar logicamente placas de sistema instaladas a partir do sistema operacional enquanto o domínio continua a executar aplicações sem interrupção.
• As funções de Administração de domínios suportam a criação de placas de sistema lógicas compostas de unidades Uni- XSB e Quad-XSB.
• Os recursos de Administração de auditoria registram as interações entre o XSCF e os domínios.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
38
• Os comandos da Administração de fontes de alimentação permitem a configuração da operação de grade de energia dupla do servidor SPARC Enterprise M8000 e M9000, bem como o monitoramento e controle da energia aos componentes dos servidores SPARC Enterprise M4000, M5000, M8000 e M9000.
• Os recursos de monitoramento, geração de relatórios e manipulação do status do hardware fornecem a interpretação das informações de hardware apresentadas e a notificação de problemas iminentes como altas temperaturas ou problemas no fornecimento de energia, além do acesso à interface de administração do sistema.
• A função Oracle Solaris Predictive Self Healing associa-se ao XSCF, ajudando a melhorar a disponibilidade através de diagnósticos de falhas precisos e análises preditivas de falhas.
• Os recursos de Diagnóstico automático e recuperação de domínio suportam a execução e o monitoramento de programas de diagnóstico como o Open Boot Prom (OBP) e o POST.
• As operações de Capacidade sob demanda fornecem a possibilidade de manter e, posteriormente, ativar recursos de processamento adicionais.
• As funções de failover do XSCF incluem o monitoramento da configuração dupla do XSCF nos servidores SPARC Enterprise M8000 e M9000 para falhas e execução de um failover automático conforme necessário.
Funções Flexíveis para Operadores e Administradores
Além do monitoramento e gerenciamento remoto, o controle de acesso administrativo continua sendo uma questão importante para a maximização da disponibilidade do sistema. Em alguns ambientes, mesmo operadores bem-intencionados podem acidentalmente gerar tempo de inatividade. Ao mesmo tempo, mecanismos de controle de acesso inconsistentes pode causar fraudes dos protocolos estabelecidos, comprometendo ainda mais a disponibilidade e segurança.
O XSCF Control Package simplifica a administração de diversos domínios autônomos de forma independente por administradores de sistema e operadores diferentes — todos cooperando dentro de um único servidor SPARC Enterprise M-Series. Este software de gerenciamento suporta diversas contas de usuário que são organizadas em grupos. Diferentes privilégios são atribuídos a cada grupo. Os privilégios permitem que um usuário execute um conjunto de ações em um conjunto específico de hardware, incluindo componentes físicos, domínios, ou componentes físicos dentro de um domínio. Além disso, um usuário pode possuir múltiplos privilégios em múltiplos domínios. As definições específicas para cada tipo de privilégio são listadas na Tabela 11.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
39
TABELA 11. PRIVILÉGIOS DEFINIDOS DO XSCF CONTROL PACKAGE
PRIVILÉGIO
RECURSOS
NENHUM
• Sem privilégios
USERADM
• Criar, excluir, desabilitar e desativar contas de usuários, senhas de usuários, privilégios de usuários
• Visualizar todos os estados de plataforma
PLATADM
• Todas as configurações do processador de serviço que não sejam tarefas do useradm e auditadm
• Atribuir e cancelar atribuição de hardwares em domínios
• Operações de energia do domínio e do processador de serviço
• Todas as operações no hardware do domínio
• Operações de failover no processador de serviço em sistemas com mais de um XSCF
• Visualizar todos os estados de plataforma
PLATOP
• Visualizar todos os estados de plataforma
DOMAINADM
• Executar todas as operações, incluindo alterações de hardware a domínios nos quais este privilégio é mantido
• Visualizar todos os estados de hardware atribuídos a domínios nos quais este privilégio é mantido
• Visualizar todos os estados de domínio nos quais este privilégio é mantido
DOMAINMGR
• Executar operações de energia no domínio
• Visualizar todos os estados de hardware no domínio nos qual este privilégio é mantido
• Visualizar todos os estados de domínio nos quais este privilégio é mantido
DOMAINOP
• Visualizar todos os estados de hardware no domínio nos qual este privilégio é mantido
• Visualizar todos os estados de domínio nos quais este privilégio é mantido
AUDITADM
• Configurar auditoria
• Excluir trilha de auditoria
AUDITOP
• Visualizar todos os estados de auditoria e a trilha de auditoria
FIELDENG
• Executar todas as operações reservadas para engenheiros de campo
Ferramentas de gerenciamento da plataforma
Os softwares Sun Management Center e Oracle Enterprise Manager Ops Center, bem como outras ferramentas de terceiros oferecem funções avançadas de gerenciamento que complementam os recursos do XSCF Control Package. Para simplificar a integração, o XSCF pode comunicar com as ferramentas de gerenciamento do sistema habilitando um agente de Simple Network Management Protocol (SNMP) no processador de serviço. A interface de rede no processador de serviço facilita a transferência de dados para gerentes de SNMP dentro de aplicações de gerenciamento de terceiros. O SNMP v1, v2 e v3 e o acesso simultâneo de vários gerentes de SNMP é suportado.
O agente de SNMP pode exportar os seguintes tipos de informação para um gerente de SNMP:
• Informações do sistema como ID do gabinete, tipo de plataforma, número total de CPUs e memória total
• Configuração de hardware
• Informações de reconfiguração dinâmica, incluindo a atribuição de recursos a domínios
• Status do domínio
• Status de energia
• Status ambiental
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
40
O agente de SNMP do processador de serviços pode fornecer informações do sistema e de eventos de falha usando MIBs públicas. O XSCF suporta a configuração do seguintes dois MIBs:
• O MIB de extensão do XSCF (SP-MIB) fornece informações sobre o status e configuração da plataforma. Para eventos de falha, o SP-MIB envia uma interceptação com informações de falha básicas.
• O MIB de gerenciamento de falhas (FM-MIB) registra dados de eventos de falha. O FM-MIB fornece as mesmas informações detalhadas que o MIB FMA em um domínio do Solaris. Esses dados podem ajudar técnicos de serviço a diagnosticar falhas.
Oracle Enterprise Manager Ops Center
O software Oracle Enterprise Manager Ops Center é uma plataforma de gerenciamento de data center altamente escalonável. Este software fornece às organizações sistemas de gerenciamento de ciclo de vida e recursos de automação de processos para ajudar a simplificar o gerenciamento da plataforma consolidada, relatórios de conformidade e tarefas provisionamento do sistema. O Oracle Enterprise Manager Ops Center fornece um único console para ajudar a detectar, provisionar, atualizar e gerenciar ambientes de TI heterogêneos globalmente dispersos, que podem incluir hardware Oracle e de outros fabricantes executando sistemas operacionais Microsoft Windows, Linux e Oracle Solaris. Um exemplo da interface do console do Oracle Enterprise Manager Ops Center é mostrado na Figura 14.
Figura 14. Exemplo de exibição do Console do Oracle Enterprise Manager Ops Center
O Oracle Enterprise Manager Ops Center pode ajudar empresas a provisionar e administrar ativos físicos e virtuais de data centers, e oferece os seguintes recursos:
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
41
• Monitoramento do sistema. O Oracle Enterprise Manager Ops Center fornece funções de monitoramento enquanto minimiza qualquer carga de rede incremental. Capaz de detectar um sistema se comunicando com seu sistema operacional ou processador de serviço, o Oracle Enterprise Manager Ops Center pode fornecer dados sobre possíveis falhas e atributos dos servidores Sun Fire e SPARC Enterprise de forma a ajudar a equipe operacional a monitorar sistemas com um treinamento mínimo. O Oracle Enterprise Manager Ops Center também possibilita o monitoramento do uso de energia em qualquer sistema apto e, em seguida, agrega essa informação relacionando a grupos de servidores, de forma que a energia possa ser associada com uma determinada aplicação. É obtida uma amostra do uso de energia a cada cinco minutos, e a média horária é usada para calcular a quantidade de kWh, que pode ser facilmente mapeada para o custo.
Ao tirar proveito dos recursos do processador de serviço, o Oracle Enterprise Manager Ops Center permite que o hardware seja gerenciado de forma centralizada, sem a implantação de agentes. Entretanto, para o monitoramento do nível do sistema operacional, o Oracle Enterprise Manager Ops Center usa um agente de software que pode ser automaticamente instalado a partir de qualquer camada de controle do Oracle Enterprise Manager Ops Center.
• Gerenciamento do ciclo de vida de ambientes físicos e virtuais. O Oracle Enterprise Manager Ops Center pode gerenciar um conjunto heterogêneo de sistemas (desde metal puro até sistemas operacionais) por todo seu ciclo de vida, desde o primeiro momento em que energia é aplicada até a retirada do servidor de operação. Os recursos de gerenciamento do ciclo de vida de software do Oracle Enterprise Manager Ops Center incluem a automação de tarefas como downloads de patches, backup de estado do sistema, identificação de patches, instalação de patches de pré-requisito e a instalação do patch. O Oracle Enterprise Manager Ops Center também pode simplificar o gerenciamento de ambientes virtuais através da capacidade de detecção, criação, destruição, interrupção, início, clonagem, cópia e modificação da configuração durante o tempo de execução de uma determinada MV, bem como dos agrupamentos lógicos dos sistemas. O Oracle Enterprise Manager Ops Center pode ajudar a simplificar o rastreamento as recomendações de fornecedor ou perfis personalizados específicos por local, impondo políticas através do data center e fornecendo relatórios que documentam, rastreiam e fazem auditoria de medidas de conformidade.
• Tarefas de provisionamento do sistema operacional. Com o Oracle Enterprise Manager Ops Center, as tarefas que eram executadas de servidor em servidor, ou de sistema operacional em sistema operacional, agora podem ser executadas em grupos de recursos. Isso não somente aumenta a produtividade, mas também ajuda a manter os ambientes atualizados, incluindo os patches de software e firmware que permitem que os data centers operem de forma segura. Os aspectos de um provisionamento de sistema suportado pelo Oracle Enterprise Manager Ops Center inclui a detecção de ativos que data center usando mecanismos e protocolos, configuração de gerenciamento de lights-out, gerenciamento ativo remoto, acesso transparente a diversas ferramentas de provisionamento de sistemas operacionais dentro do Oracle Solaris, Red Hat Enterprise Linux (RHEL), Oracle Enterprise Linux (OEL) e SUSE Linux Enterprise Server (SLES), e a criação de sistemas de arquivos de sistemas operacionais, compartilhamentos e serviços.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
42
Arquitetura do Oracle Enterprise Ops Center
O Oracle Enterprise Manager Ops Center é construído usando uma arquitetura escalonável, distribuída e segura. A arquitetura de três camadas usa um controlador centralizado juntamente com proxies distribuídos que mantêm os dados locais e protegidos. Essa arquitetura melhora o desempenho minimizando a quantidade de dados que devem ser transmitidos entre os controladores proxy e os recursos do controlador corporativo no Oracle Enterprise Manager Ops Center. Além disso, essa arquitetura permite que o Oracle Enterprise Manager Ops Center opere dentro de configurações complexas de rede e de firewall, bem como grupos isolados de aplicações que podem ser distribuídos por todo o mundo.
Quando usado em conjunto com os servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000, o Oracle Enterprise Manager Ops Center pode automatizar a manutenção e o gerenciamento do ciclo de vida do patch. O Oracle Enterprise Manager Ops Center pode ajudar administradores de sistema a automatizar instalações de software, simulação, reversão, verificação de conformidade, relatórios e muitas outras atividade relacionadas. O Oracle Enterprise Manager Ops Center também pode ser usado para detectar a tecnologia de serviço incorporada ao processador de serviço e domínios em execução no Oracle Solaris nos servidores SPARC Enterprise M3000, M4000, M5000, M8000 e M9000.
A estrutura do software Solaris JumpStart é utilizada pelo Oracle Enterprise Manager Ops Center para provisionar de forma eficaz o Oracle Solaris para domínios individuais. O Oracle Enterprise Manager Ops Center também ajuda a agilizar e controlar ações administrativas a partir de um local centralizado para ajudar a garantir a responsabilização e auditoria. Esses recursos de automação podem ser usados para o gerenciamento de alterações com base em conhecimento juntamente com investimentos no gerenciamento da configuração existente. A utilização do Oracle Enterprise Manager Ops Center pode ajudar as organizações e criar um ambiente mais confiável que ofereça considerável economia de custo através da redução de manutenção e a capacidade de reconstruir rapidamente os sistemas conforme necessário.
Sun Management Center
Para ambientes antigos que ainda usam o software Sun Management Center da Oracle para gerenciamento de servidores, os servidores SPARC Enterprise M-Series fornecem um agente MC da Sun em cada XSCF. O Sun Management Center apresenta uma exibição lógica dos sistemas Sun, onde uma unidade de sistema lógica é definida como um único servidor Sun ou como um domínio dentro de um servidor. Para suportar redes antigas e ambientes heterogêneos, o software Sun Management Center se integra totalmente às principais estruturas de gerenciamento incluindo CA Unicenter TNG, HP Open-View, IBM Tivoli e BMC Patrol.
Para sistemas SPARC Enterprise M3000, M4000, M5000, M8000 e M9000, o software Sun Management Center retém o modelo de plataforma e gerenciamento de domínios estabelecido pelo XCSF e XSCF Control Package. Ao sincronizar as permissões e listas de controle de acesso, os mesmos recursos disponíveis aos usuários da interface de linha de comando do XSCF ficam disponíveis aos usuários do software Sun Management Center. Os administradores e operadores podem receber somente o acesso necessário para executar as tarefas.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
43
O software Sun Management Center também pode ser usado para gerenciar a Reconfiguração dinâmica dentro dos servidores SPARC Enterprise M4000, M5000, M8000 e M9000, incluindo a criação de domínio, acoplamento dinâmico de placa e o desacoplamento dinâmico. (As operações reais de acoplamento e desacoplamento são executadas dentro do domínio afetado, enquanto o software Sun Management Center fornece a interface de usuário para iniciar essas atividades.) O software Sun Management Center pode se comunicar com o XSCF para recuperar as informações de status não somente para os domínios ativos, mas também para as placas que não estão atualmente atribuídas a um domínio — um requisito importante para o gerenciamento da implantação de recursos entre domínios.
Otimização do ambiente com os Serviços e Treinamento da Oracle
A obtenção de 99,99% de tempo de atividade permite que haja somente uma hora de tempo de inatividade por ano. Se empurrarmos os níveis de disponibilidade um pouco mais para 99.999% de tempo de atividade, a janela de tempo de inatividade é reduzida para não mais que 5 minutos por ano. Conforme diminui o espaço para erros, as contribuições que as pessoas e processos fazem para os níveis de disponibilidade ganham ainda mais importância. Os serviços profissionais e educacionais da Oracle podem ajudar as organizações a ajustarem seus processos, bem como treinar ou complementar a equipe de TI. Ao tirar proveito da ampla experiência práticas recomendadas e ofertas inovadoras de serviços gerenciados da Oracle, as empresas podem reduzir os possíveis riscos e melhorar a estabilidade e o desempenho dos serviços de TI.
O envolvimento de cada cliente Oracle com sistemas Sun inclui:
• Trabalho colaborativo com equipes internas e parceiros para compartilhar o aprendizado
• Avaliação dos negócios através de investimentos em tecnologia
• Aceleração das implementações de projetos com redução do risco
• Estabelecimento de processos de data center altamente eficientes e que podem ser repetidos baseados em práticas recomendadas e soluções automatizadas
• Desenvolvimento da experiência dentro da empresa através da transferência de conhecimento e treinamento
O portfólio de serviços e as ofertas de suporte da Oracle incluem consultoria de tecnologia, serviços educacionais e programas de treinamento, e planos de serviço para soluções de hardware e software da Sun. O monitoramento e gerenciamento proativo incluindo ofertas de gerenciamento remoto e serviços gerenciados também está disponível. A organização de serviço e suporte global da Oracle é complementada por uma ampla rede de parceiros de serviço e suporte. Detalhes adicionais sobre essas ofertas estão descritos abaixo e no seguinte site da Web: http://www.oracle.com/us/support.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
44
Pacote de serviços profissionais da Oracle
Os serviços profissionais da Oracle aceleram a conquista de importantes metas corporativas através da implantação rápida e perfeita dos produtos e tecnologias da Sun. Ao tirar proveito da experiência da Oracle, novos servidores podem ser colocados em produção rapidamente com resultados previsíveis de confiabilidade e disponibilidade. A utilização desta experiência também pode ajudar a equipe de TI a permanecer concentrada em prioridades estratégicas em vez de atividades secundárias como a implantação de componentes de infraestrutura de TI.
O portfólio de serviços profissionais da Oracle para os sistemas Sun é composto de serviços que ajudam as empresas a reduzir o risco na adoção de tecnologias e otimizar os investimentos em produtos de hardware e software da Sun. Esses serviços não somente ajudam a aliviar a equipe de TI de tarefas não estratégicas, mas também fornecem uma base para a estabilidade e desempenho do sistema. A Tabela 12 oferece uma lista de serviços profissionais oferecidos pela Oracle e seus parceiros. Informações detalhadas sobre essas ofertas estão disponíveis em http://www.oracle.com/us/support/systems/advanced-customer-services.
TABELA 12. OFERTAS DE SERVIÇOS PROFISSIONAIS
SERVIÇOS PROFISSIONAIS
DESCRIÇÃO
SERVIÇOS DE CONSULTORIA DE DATA CENTER
Os serviços de Consultoria de data center ajudam as organizações a planejar, implementar e gerenciar um ambiente de data center otimizado. O abrangente portfólio da Oracle de serviços de consultoria de data center cobrem tudo deste a otimização da infraestrutura de TI existente até a ajuda no planejamento e construção de um novo data center para atender às demandas de expansão. Este serviço pode ajudar no planejamento e implementação de uma estratégia de infraestrutura completa de data center no que diz respeito a componentes de computação, rede e infraestrutura.
WORKSHOP PARA DEFINIÇÃO DE SERVIÇO
O Workshop para Definição de Serviço da Sun fornece uma avaliação detalhada das metas atuais de TI e de negócios, e estabelece um planejamento claro e viável para garantir que os objetivos estejam corretamente alinhados para obter o sucesso no longo prazo. Utilizando um formato interativo de workshop, os consultores trabalham com a liderança de TI para entender os desafios dentro do ambiente atual de TI, articular a visão operacional que melhor atende às necessidades da organização e desenvolver um plano de ação que esteja fortemente conectado aos requisitos reais de negócios, e que seja direcionado por eles, para atingir o objetivo.
SERVIÇO DE AVALIAÇÃO DA CAPACIDADE DE OPERAÇÃO
O Serviço de Avaliação da Capacidade de Operação estabelece uma referência sobre a capacidade de uma organização gerenciar de forma eficiente sua operação de TI interna. Métricas e critérios bem definidos são usados para avaliar a capacidade de pessoas, processos e ferramentas. Este serviço pode incluir uma análise completa do ambiente de TI ou uma avaliação focalizada, concentrando em determinadas áreas críticas.
SERVIÇO DE OTIMIZAÇÃO DO GERENCIAMENTO DO SERVIÇO DE TI
Como a mais amplamente aceita abordagem de gerenciamento de serviço de TI no mundo, a IT Infrastructure Library (ITIL) fornece uma estrutura consistente de práticas recomendadas, obtida dos setores público e privado por todo o mundo. A implementação dos processos da ITIL é essencial para melhorar a eficiência e o valor agregado dos serviços de TI. O Serviço de Otimização do Gerenciamento do Serviço de TI baseia-se na estrutura da ITIL estabelecida para fornecer uma solução rápida, fácil de usar e sob medida. O conhecimento acumulado e a experiência dos especialistas em gerenciamento de serviços de TI da Oracle são capturados em uma base de dados de conhecimento personalizada para fornecer processos específicos orientados a ações. Esses processos podem então formar a base das mudanças organizacionais e treinamentos, personalização de ferramentas de gerenciamento de serviço e aprimoramento contínuo.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
45
CONJUNTO DE INFRAESTRUTURA DINÂMICA
O Conjunto de Infraestrutura Dinâmica de Serviços ajuda as organizações a reagirem rapidamente às mudanças das exigências de mercado facilitando a criação de uma infraestrutura de TI flexível, eficiente e segura. Consequentemente, as organizações podem adicionar, remover ou ampliar os serviços corporativos até 80% mais rápido, sem a sobrecarga de novos sistemas.
SERVIÇOS DE INSTALAÇÃO CORPORATIVA
O Serviço de Instalação Corporativa oferece uma configuração de servidor rápida e básica por engenheiros experientes. Metodologias de instalação padronizadas são aplicadas com base em práticas recomendadas para garantir que os sistemas estejam corretamente configurados e que os patches e atualizações mais recentes estejam instalados de forma que os sistemas sejam executados no nível ideal desde o início.
Serviços de Gerenciamento
Os Serviços de Gerenciamento Sun da Oracle fornecem gerenciamento dinâmico de infraestrutura de TI que otimiza as operações no data center enquanto ajuda as empresas a reterem o controle da direção e estratégia do programa de TI. Com base nos princípios de flexibilidade e escolha, os Serviços de Gerenciamento Sun têm a intenção de reduzir o custo operacional de TI através dos melhores serviços gerenciados da categoria. Um único ponto de contato entre o cliente e os provedores do serviço ajuda a cortar a complexidade do gerenciamento. Os Serviços de Gerenciamento Sun também são fundamentados em princípios largamente reconhecidos de práticas recomendadas em gerenciamento de serviço de TI, fornecendo métodos estruturados para a avaliação e aprimoramento contínuos dos serviços de TI.
Diversas empresas obtêm melhores resultados permanecendo no controle de seus programas de TI ao tirar proveito das competências de fornecedores externos. As condições de negócios mudam rapidamente e a melhor forma de usar de usar serviços externos deve mudar com o tempo. Os Serviços de Gerenciamento Sun fornecem às organizações mais liberdade para a modificação de arranjos de aquisição de fornecedores conforme a evolução dos requisitos de negócios.
O portfólio dos Serviços de Gerenciamento Sun inclui serviços que variam de ofertas empacotadas de escopo relativamente fixo a envolvimentos personalizados construídos a partir de uma ampla gama de recursos. Os envolvimentos personalizados são baseados nos acordos de nível de serviço que definem os serviços personalizados a serem fornecidos e um meio objetivo de medir o sucesso do fornecimento do serviço. A Tabela 13 descreve as ofertas empacotadas dos Serviços de Gerenciamento Sun que podem ser associadas e ajustadas sob medida para criar uma solução exclusiva para cada situação. A flexibilidade oferecida pelos Serviços de Gerenciamento Sun pode ajudar as organizações a melhorar a eficiência das operações de TI e superar as deficiências de habilidade em TI sem perder o controle e a direção dos programas.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
46
TABELA 13. OFERTAS DE SERVIÇOS DE GERENCIAMENTO DA SUN
OFERTA DE GERENCIAMENTO DE SERVIÇO
DESCRIÇÃO
GERENCIAMENTO DE OPERAÇÕES LOCAL DA SUN
O Gerenciamento de Operações Local da Sun é um serviço personalizado que fornece recursos dedicados para ajudar a garantir o sucesso de ambientes críticos. Os especialistas técnicos da Sun podem ajudar a reduzir o risco operacional durante a implementação de novas soluções ou simplesmente fornecer acesso a conjuntos principais de habilidades conforme necessário.
GERENCIAMENTO DE OPERAÇÕES REMOTO DA SUN
O Gerenciamento de Operações Remoto da Sun oferece gerenciamento e monitoramento remoto e heterogêneo de todos os componentes de uma infraestrutura de TI, incluindo o sistema operacional, aplicações terceirizadas e personalizadas, bancos de dados, redes, segurança e armazenamento. Este serviço cria soluções personalizadas de monitoramento e gerenciamento com base nos componentes selecionados. Além disso, está disponível conhecimento altamente especializado para suportar o gerenciamento de operações remoto de serviços de armazenamento e identidade.
HOSTING GERENCIADO DA SUN
Os recursos de Hosting Gerenciado fornecem segurança de rede e do site, com proteção contra incêndio, terremotos, enchentes e outros desastres naturais. Além disso, opções de controle de acesso biométrico e proteção contra balas estão disponíveis, caso seja necessário. Os sistemas são armazenados em gabinetes individuais, caixas dedicadas ou locais privados. As instalações suportam serviços ininterruptos com alimentação redundante, resfriamento e topologias de rede sem nem um único ponto de falha e recursos de expansão da largura de banda. Acordos de nível de serviço de alimentação de energia, resfriamento e disponibilidade de rede, juntamente com relatórios abrangentes, também estão disponíveis.
Serviços educacionais
As pessoas e processos contribuem enormemente para a disponibilidade do serviço, tornando importantes a priorização do treinamento e avaliação de habilidades em TI. Os sistemas de gerenciamento de aprendizado da Oracle e soluções de aprendizado técnico podem ajudar a manter as habilidades de sua equipe de TI atualizadas, acelerando o desempenho individual, ao mesmo tempo em que aumenta a produtividade.
Muitas organizações que compram sistemas como servidores SPARC Enterprise M-Series envolvem-se em grandes projetos que podem exigir habilidades adicionais por toda a organização. É recomendável iniciar esses tipos de projetos com uma avaliação das pessoas atribuídas a novas funções e uma avaliação de suas habilidades atuais e desejadas. A partir deste ponto, um planejamento de aprendizado sob medida pode ser desenvolvido e aplicado.
O portfólio de aprendizado da Oracle inclui serviços que variam de análises iniciais e avaliação de habilidades para treinamento e certificação. Antes do início do projeto, a Oracle pode identificar falhas de habilidade por toda a organização analisando a estrutura organizacional e avaliando as habilidades da equipe em cada área. As habilidades individuais podem então ser desenvolvidas através de uma variedade de modalidades de treinamento conforme descrito abaixo. Por fim, a Oracle oferece certificação para o conhecimento e habilidades adquiridos através de treinamento formal e experiência diretamente na tarefa como uma forma de medir o sucesso, fornecendo aos indivíduos e gerentes confiança sobre as habilidades recém-desenvolvidas.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
47
Uma variedade de modos de aprendizado
Para ajudar os gerentes de TI a planejar, selecionar, treinar e gerenciar uma equipe de TI de alto desempenho, as soluções de treinamento da Oracle incluem uma variedade de formatos de aprendizado, incluindo:
• Treinamento tradicional em sala de aula. As instalações de treinamento em sala de aula tradicional da Oracle ao redor do mundo fornecem acesso a experiência e softwares educacionais em uma sala de aula que oferece fácil acesso às tecnologias abordadas no curso. Os softwares educacionais da Oracle incluem treinamento de habilidades e certificações em tecnologias de ponta desenvolvidas pela Oracle.
• Treinamento no local. A Oracle leva instrutores especialistas até o local para treinar a equipe de TI de uma organização, eliminando a necessidade de viagem do funcionário e permitindo que as equipes compartilhem nos programas de treinamento.
• Treinamento personalizado. A Oracle fornece conteúdo de treinamento personalizado para atender aos requisitos específicos do projeto.
• Aprendizado on-line. Os indivíduos ou equipes de TI podem acessar conteúdo da Web no seu próprio ritmo ou utilizar treinamento em Classes virtuais ao-vivo que combina os pontos fortes do treinamento tradicional em sala de aula com a facilidade de uso e acessibilidade global da Internet.
• Cursos em CD-ROM. Cursos fornecidos através de CD-ROM são uma excelente forma de fornecer treinamento de competência nas áreas principais para indivíduos sem necessidade de viagens ou períodos prolongados de ausência.
Certificação
A experiência, treinamento e estudo necessários para obter uma certificação técnica aumenta as habilidades e conhecimento de um funcionário, melhorando, assim, a auto-confiança e a produtividade. Do ponto de vista do indivíduo, a certificação aumenta a chance de aumento de salário e avanço na carreira. As organizações obtêm valor agregado de diversas formas. Ao incluírem profissionais certificados pela Oracle na equipe, as empresas integradoras de sistema e de consultoria de software podem ganhar credibilidade na visão de seus clientes, melhorando, assim, a oportunidade de aumento de receita e contratos adicionais. A equipe certificada também pode fornecer aos gerentes de TI um nível maior de confiança para alcançar as metas de obtenção de altos níveis de serviço com máximo desempenho e disponibilidade do sistema.
Serviço e Suporte
Manter os sistemas de hardware e software atualizados e operando sem problemas é essencial para a disponibilidade de serviço da aplicação. A Oracle oferece uma variedade de serviços de suporte e gerenciamento contínuo para ajudar as organizações de TI a cumprirem os acordos de nível de serviço e ajudar a minimizar o Custo total de propriedade (TCO).
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
48
Oracle Premier Support para Sistemas
O Oracle Premier Support para Sistemas fornece às organizações um suporte completo para os servidores e sistemas de armazenamento de dados da Oracle. As organizações podem confiar nos serviços de assistência técnica estendida e suporte global abrangente da Oracle para ajudar a maximizar o retorno do investimento de TI e minimizar o risco.
O Oracle Premier Support para Sistemas inclui os seguintes serviços:
• Suporte completo do sistema
• Suporte totalmente integrado a hardware do servidor, SO e software de virtualização
• Suporte de sistema de armazenamento crítico
• Suporte ininterrupto
• Acesso aos especialistas da Oracle
• Ferramentas de diagnóstico remoto
• Suporte vitalício para o SO e software de virtualização
• Recursos on-line 24 horas por dia, 7 dias por semana
• Base de dados de conhecimento da Oracle
• Documentação do produto
• Comunidades de suporte da Oracle
• Práticas recomendadas
• Cobertura do serviço de hardware 24 horas por dia, 7 dias por semana
• Tempo de resposta de hardware no local de duas horas3
• Solicitação de serviço automática
• Engenheiros de campo experientes
• Peças de reposição de OEM
• Pedidos de troca em campo (FCOs)
3 O sistema deve estar dentro uma área de cobertura de serviço de duas horas da Oracle para receber o tempo de resposta de duas horas como um serviço padrão.
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
49
• Ferramentas de suporte proativas
• Alertas de suporte
• Ferramentas de atualização de software
• Recursos de segurança
• Pacote de ferramentas de serviços da Sun
• Ferramentas de diagnóstico incorporadas
• Atualizações do Sistema Operacional, Firmware e Softwares incorporados
• Oracle Solaris, Oracle Enterprise Linux, Oracle VM e hardware Oracle
• Política vitalícia do sistema
• Receba suporte para seus sistemas com hardware Sun por 5 anos desde a última data de envio
O Oracle Premier Support para Sistemas oferece às organizações os seguintes benefícios:
• Acesso imediato a alto conhecimento. Receba soluções comprovadas e rápidas obtidas através da experiência de suporte de milhares de instalações de cliente ativos, de aplicações a discos.
• Risco reduzido. Acesso ininterrupto e ilimitado a especialistas de sistemas e valiosos recursos técnicos on-line ajudam as organizações a proativamente evitar interrupções nos negócios e melhorar a segurança.
• Maior desempenho. Otimize os ambientes de TI com suporte total do servidor do sistema com cobertura de hardware e SO totalmente integrada.
• Maior disponibilidade de dados. Sistema de armazenamento corporativo suporta a proteção de dados, ajudando organizações a obterem o mais valor comercial.
Para obter mais informações sobre o Oracle Premier Support para Sistemas, consulte:
http://www.oracle.com/us/support/systems/premier/index.html
Oracle Premier Support para sistemas operacionais
O Oracle Premier Support para sistemas operacionais é para organizações que estão executando o Oracle Solaris, Oracle Enterprise Linux, Oracle VM ou qualquer combinação desses produtos e optaram por não adquirir a cobertura completa do sistema. Este programa de suporte fornece suporte premiado, acesso a novas inovações de software e ferramentas de suporte proativas para qualquer ou todos esses três produtos de software principais por um excelente preço. As organizações podem proteger seus investimentos em tecnologia e manter as operações de negócios funcionando de forma eficiente com o Oracle Premier Support para sistemas operacionais. Para obter mais informações sobre esse programa de suporte, consulte:
http://www.oracle.com/us/support/systems/operating-systems/index.html
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
50
Oracle Advanced Customer Services para sistemas
A disponibilidade dos sistemas de TI e sua operação eficiente são essenciais para a sobrevivência dos negócios. O Oracle Advanced Customer Services para sistemas fornece profundo conhecimento sobre a implantação, gerenciamento e otimização dos sistemas Sun da Oracle, melhorando o desempenho, aumentando a disponibilidade e reduzindo os tempos de implementação.
O Oracle Advanced Customer Services para sistemas fornece suporte e orientação para melhorar a implementação e operação dos sistemas da Sun. Este programa de suporte fornece uma ampla gama de serviços maduros que resolvem necessidades específicas. Com recursos de fornecimento no local e remoto, o Oracle Advanced Customer Services para sistemas oferece acesso às habilidades e conhecimento que as organizações precisam.
As ofertas do Oracle Advanced Customer Services para sistemas incluem o seguinte:
• Oracle Expert Service para sistemas. Tire proveito do conhecimento dos especialistas da Oracle para configurar e otimizar os ambientes de sistema para atender a necessidades exclusivas da organização. Os especialistas fornecidos através deste serviço podem personalizar uma solução, gerenciar tarefas administrativas e supervisionar a logística e os requisitos do sistema de ambientes de TI em crescimento e passando por mudanças.
• Oracle Operations Management para sistemas. Tire proveito da enorme experiência obtida a partir do suporte de milhares de sistemas ao redor do mundo, ininterruptamente. Como parte deste serviço, especialistas altamente capacitados em tecnologia e operações, usando ferramentas exclusivas da Oracle, ajudam a manter a infraestrutura de TI funcionando sem problemas.
• Oracle Packaged Services para sistemas. Serviços empacotados fornecidos por especialistas em sistemas da Oracle podem ajudar as organizações a acelerar o tempo para implantação e melhorar a confiabilidade e a eficiência do sistema.
Para obter mais informações sobre o Oracle Advanced Customer Services para sistemas, consulte:
http://www.oracle.com/us/support/systems/advanced-customer-services/index.html
Artigo Técnico da Oracle — Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle
51
Resumo
Os níveis de disponibilidade de sistemas críticos de negócios são resultado da interação de pessoas, processos e produtos por todo o ciclo de vida de um projeto. Ao assumir uma abordagem abrangente para resolver a disponibilidade, as organizações podem melhorar o tempo de atividade e ainda obter uma ampla gama de vantagens comerciais, incluindo maior eficiência operacional, custos reduzidos e melhor Retorno do investimento.
Os produtos e serviços da Oracle oferecem os três pontos fortes a seguir para to ajudar as empresas a desenvolver soluções de baixo custo e altamente disponíveis:
• Arquiteturas de servidor altamente confiáveis. Os servidores SPARC Enterprise M4000, M5000, M8000 e M9000 da Oracle, o Oracle Solaris e o Oracle Solaris Cluster fornecem uma ampla variedade de recursos de confiabilidade, disponibilidade e facilidade de manutenção para maximizar o tempo de atividade e minimizar o tempo de recuperação. Esses recursos são resultado de aprimoramentos contínuos em tecnologias de hardware, sistema operacional e software.
• Automação para solidificar os processos de gerenciamento de sistema. As ferramentas de gerenciamento da Sun podem ajudar as organizações a melhorar a aderência a práticas recomendadas e reduzir a complexidade para suportar e gerenciar serviços de aplicação altamente disponíveis. Os recursos de gerenciamento incorporados do servidor SPARC Enterprise M-Series da Oracle, o software Sun Management Center e o software Oracle Enterprise Manager Ops Center ajudam a facilitar o gerenciamento eficaz de grandes quantidades de servidores.
• Suporte e experiência comprovada. Os serviços profissionais da Oracle, as ofertas educacionais inovadoras, as ferramentas de suporte e as soluções proativas de monitoramento e gerenciamento podem ajudar as organizações a arquitetar, implementar e gerenciar melhores soluções de TI que maximizam os níveis de disponibilidade e reduzem custos.
Para obter mais informações
Para obter mais informações sobre os servidores SPARC Enterprise M-Series da Oracle e softwares e serviços relacionados da Oracle, consulte as referências listadas na Tabela 14.
TABELA 14. REFERÊNCIAS
Servidores SPARC Enterprise
http://www.oracle.com/us/products/servers-storage/servers/sparc-enterprise
Oracle Solaris
http://www.oracle.com/us/products/servers-storage/solaris
Oracle Solaris Cluster
http://www.oracle.com/us/products/servers-storage/solaris
Software Oracle Enterprise Manager Ops Center
http://www.oracle.com/us/products/enterprise-manager/opscenter
Suporte Oracle
http://www.oracle.com/us/support/index.html
Alta Disponibilidade para Serviços de TI Críticos para os Negócios Usando Servidores SPARC Enterprise M-Series da Oracle

SE GOSTOU DEIXE UM COMENTÁRIO

por Paulista Postado em Rede Com a tag