Programar em C/Tipos de dados

'

Até agora você só viu as variáveis do tipo int, que servem para guardar números inteiros. A linguagem C tem outros tipos fundamentais. São eles:

int, para números inteiros entre -2147483648 e 2147483647, utiliza 4 bytes;
char, para caracteres individuais do padrão ASCII, utiliza 1 byte;
float, para reais entre (aproximadamente) 10^-38 e 10³⁸, utiliza 6 bytes, precisão de 8 dígitos;
double, para reais entre (aproximadamente) 10^-4932 e 10⁴⁹³², utiliza 8 bytes, precisão de 15 dígitos;
bool, para indicar true (verdadeiro) ou false (falso), utiliza 2 bytes; Presente apenas no padrão C99 em diante.

Explicando bits e bytes

Podemos pensar na memória do computador como uma fita, uma grande fita feita de frames sequenciais.

Em cada um desses frames, podemos colocar uma certa tensão: tem tensão ou não tem tensão: se tem tensão associamos o valor 1, se não tem tensão associamos o valor 0. Daí termos a linguagem binária de zeros e uns.

Agora podemos fazer combinações se tivermos posição de zeros e uns, da direita para a esquerda.

00000000 1ª Combinação
00000001 2ª Combinação
00000010 3ª Combinação
00000011 4ª Combinação
00000100 5ª Combinação
00000101 6ª Combinação
00000110 7ª Combinação
00000111 8ª Combinação
…

E na verdade podemos estender este conceito para um número infinito de combinações.

Ora o que aconteceu é que nos bastavam pouco menos de 256 combinações (8 bits ordenados) para termos uma combinação para cada letra, maiúscula e minúscula, número, pontos de exclamação, interrogação, etc. … e isso era o suficiente para a nossa comunicação. Mas para haver um certo consenso para que uma dada combinação desse um dado símbolo surgiu a tabela ASCII (surgiram outras tabelas quando se quis colocar os símbolos de outras línguas, como o japonês ou o chinês – ver tabela ISO) Portanto com 8 bits ou 8 casas conseguíamos ter qualquer símbolo que utilizamos. A esse conjunto de 8 bits chamamos de byte, mais convenientemente. Portanto, um byte tem 8 casas de zeros/uns, ou seja 2 elevado a 8 dá as 256 combinações. E o byte é a unidade básica que o C++ consegue operar e é representado pelo tipo char.

Pergunta: Quando tivermos mais do que 256 bytes acrescenta-se um outro byte?

Sim. Com dois bytes o número de combinações é 256*256.

Pergunta: Qual a razão do computador usar apenas bytes como medida mínima? Será que não seria possível utilizar 7 bits ou 5 bits?

A razão para isso é que a infraestrutura física (hardware) dos computadores atuais apenas aceita bytes nativamente. Porem seria possível projetar um novo tipo de computador que calculasse mais eficientemente utilizando se números diferentes de bits.

Números inteiros

Se dissermos que 2 bytes representam inteiros, poderemos utilizar as 65.536 combinações, pois 2 bytes - 16bits - temos 2 elevado a 16 = 65.536 e isso dar-nos-ia esses números todos. Assim se quisermos apenas os positivos com o zero temos de [0,65535].

Se quisermos ter números negativos e positivos podemos dividir esse valor a meio e dá 32.768 para cada lado positivo e negativo, mas como temos de ter o zero vamos roubar um valor ao lado positivo e então ficamos com o intervalo [-32768, 32767]. E ficamos com as mesmas 65.536 combinações.

Apresentamos inteiro com 2 bytes, mas eles podem ter 4 bytes, isso vai depender do processador do computador, e, com quantos bytes consegue ele lidar ao mesmo tempo.

Também existem outros tipos, como short (ou short int), que serve para inteiros menores, long (ou long int) para inteiros maiores. Qualquer tipo inteiro pode ser precedido por unsigned (o signed para COM negativos), para cortar os números negativos, permitindo maior capacidade de armazenamento de números positivos. Alguns compiladores aceitam o long long, para aumentar ainda mais o tamanho da variável, alguns desses só aceitam para o tipo int, outros também para o tipo double.

Podemos alterar a maneira como os dados são guardados com os modificadores de tipo. Você pode modificar os tipos de duas maneiras.

Tamanho: `short` e `long`

Você pode modificar o tamanho de uma variável usando os modificadores de tipo, que são dois: short e long. Note que float e char não podem ser modificados em tamanho.

short diminui o espaço necessário para guardar a variável (diminuindo também a gama de valores que esta pode assumir). Só pode ser usado com int.
long aumenta o espaço tomado pela variável, e portanto aumenta seu valor máximo e/ou sua precisão. Pode ser usado com int e double.
O padrão C de 1999 adicionou um terceiro modificador, suportado pelos compiladores mais recentes, inclusive o gcc: long long, que aumentaria ainda mais a capacidade da variável. Alguns deles suportam esse modificador apenas para o tipo int, e outros suportam também para double.

Uma observação é necessária: segundo o padrão, não existe nenhuma garantia de que uma variável short int é menor que uma variável int, nem que long int é maior que int. Apenas é garantido que int não é maior que long nem menor que short. De fato, nos sistemas x86 de 32 bits (ou seja, a maioria dos computadores pessoais atualmente), o tamanho de int é igual ao de long. Geralmente, int será o tamanho nativo do processador — ou seja, 32 bits num processador de 32 bits, 16 bits num processador de 16 bits etc.

Sinal: `signed` e `unsigned`

Existe outro tipo de modificador, que define se o número vai ser guardado com sinal ou não. São os modificadores signed e unsigned, suportados pelos tipos inteiros apenas.

signed diz que o número deve ser guardado com sinal, ou seja, serão permitidos valores positivos e negativos. Esse é o padrão, portanto esse modificador não é muito usado.
unsigned diz que o número deve ser guardado sem sinal. Com isso, o valor máximo da variável aumenta, já que não teremos mais valores negativos. Por exemplo, com uma variável char podemos guardar valores de -128 a 127, mas com uma variável unsigned char pode guardar valores de 0 a 255.

Para usar esses modificadores, devemos colocá-los antes do nome do tipo da variável, sendo que o modificador de sinal deve vir antes do modificador de tamanho caso ambos sejam usados. Por exemplo:

unsigned char c;
short int valor;
unsigned long int resultado;

Nota: Você pode abreviar short int e long int para simplesmente short e long, respectivamente.

Tabela de tipos inteiros

Convém ver a tabela de tipos inteiros.

Tipo		    Num de bits	    Formato para	    Intervalo
                       		  leitura com scanf       Inicio   Fim
char	                 8		  %c		    -128   127
unsigned char	         8		  %c	 	       0   255
signed char	         8		  %c	 	    -128   127
int	                16		  %d	 	 -32.768   32.767
unsigned int	        16		  %u		       0   65.535 
signed int	        16		  %i	 	 -32.768   32.767
short int	        16		  %hi	 	 -32.768   32.767
unsigned short int      16		  %hu		       0   65.535
signed short int        16		  %hi	 	 -32.768   32.767 
long int	        32		  %li	  -2.147.483.648   2.147.483.647
signed long int         32		  %li	  -2.147.483.648   2.147.483.647
unsigned long int       32		  %lu		       0   4.294.967.295

Nota: O tipo long é 32 bits como int em computadores de arquitetura 32 bits e 64 bits em computadores de arquitetura 64 bits no padrão LP64 (Mac OS X e Unix).

Números de ponto flutuante

Os números de ponto flutuante são uma tentativa para guardar números reais, como 3,1415 (pi), -2,3333, 0,00015, 6,02 × 10²³. Ao contrário dos números reais, os números representáveis pelo hardware são finitos. A maneira como os tipos de ponto flutuante são armazenados é abstrata para o programador, entretanto, o hardware segue o padrão IEEE 754 (Standard for Floating-Point Arithmetic).

O armazenamento é feito usando notação científica binária.

Decimal Notation	Scientific Notation	E Notation
123.45	1.2345 x 10²	1.2345E2
0.0051	5.1 x 10^-3	5.1E-3
1,200,000,000	1.2 x 10⁹	1.2E9

Os tipos float e double servem para guardar números de ponto flutuante. A diferença entre os dois é, além do intervalo de dados, a precisão. Geralmente, o tipo float guarda dados (com sinal positivo ou negativo) de 3,4E-38 a 3,4E+38 (além do zero). Já double suporta números tão pequenos quanto 1,7E-308 e no máximo 1,7E+308.

float	                32	%f	3,4E-38	        3.4E+38 
double	                64	%lf	1,7E-308	1,7E+308
long double	      80/128	%Lf	3,4E-4932 	3,4E+4932

Nota: O tipo long double trabalha em máquinas x64 no padrão LP64 (Mac OS X e Unix)

Bool

Este tipo surgiu porque muitas vezes apenas se quer ter 2 valores: sim/não ; verdadeiro/falso. Tem o tamanho de um byte e tem apenas dois valores 0 e 1 que corresponde a true e false.

Por que guardar um bool num byte quando se pode utilizar apenas um bit? A razão é que o computador usa no mínimo o byte, não o bit.

Endereços

Os vários locais na memória são identificados por um address, que tem uma lógica sequencial numerada. São necessários 16 bits para guardar o endereço de um byte. dito de outra forma são necessários 2 bytes para guardar a morada de um byte. será isto verdade?! isso quer dizer que se guardarmos os endereços de todos os bytes, só temos 1/3 da memória disponível para guardar valores. Bem isto é um pouco estranho, mas repare-se que apenas vamos guardar os addresses das variáveis reservadas. Depois as variáveis nem sempre são de 1 byte, por isso apenas iremos guardar o endereço do primeiro byte e não de todos. por fim faz sentido guardar o endereço de outro endereço? Os endereços de memória (addresses) são normalmente expressos em linguagem hexadecimal (base 16, utilizam os 10 algarismos mais as 6 primeiras letras – de a até f - do alfabeto para fazerem as 16).

Compatibilidade de dados na atribuição de valor

Se tentarmos colocar um valor diferente do tipo esperado da variável? Temos um problema de compatibilidade de dados:

Caso 1: Declaramos um int e colocamos uma letra
Aqui não teremos problemas. Os literais de caracteres são, nativamente, do tipo int. O resultado será um inteiro que contém o valor ASCII do caractere dado.

Caso 2: Declaramos um int e colocamos uma string (sequência de caracteres)
Aqui teremos um erro de compilação, em que nos diz que não conseguimos converter "const char [5]" em "int". Perceba com isso que o compilador tem alguns sistemas de conversão ― note o caso 3.

Caso 3: Declaramos um int e colocamos um float
Neste caso, se colocarmos 77.33, irá ser apenas guardado o valor 77, perdendo-se a parte decimal.

Caso 4: overflow ― declaramos um short e colocamos um valor maior que o máximo
Lembre-se que o tipo short guarda valores de –32767 a 32767. Se colocarmos 32768 (e o compilador não estender esses limites), não vai acontecer nenhum erro de compilação; o que resulta é que vai ser impresso um número negativo, –32767 (ou, como é comum em vários compiladores, –32768). A lógica disto tem a ver com a maneira como o computador guarda números negativos. Mas também podemos fazer uma analogia com as horas. Imaginemos que vamos somar 6 horas com 7 horas. O resultado seria 13, mas como não existe 13 no relógio, iríamos dar a volta nas horas e chegar ao 1. Assim o resultado será 1.

Caso 5: underflow ― declaramos um short e colocamos um valor inferior ao mínimo possível.
Aqui temos exatamente a mesma lógica do caso de overflow, mas desta vez é excedido o limite inferior e não o superior.

Caso 6: declaramos um unsigned int e colocamos um número negativo
O que acontece aqui é semelhante a um underflow. Mas o que ocorre é que o número é guardado como seria se fosse um int comum, negativo. O que muda na prática é a interpretação desse número, de acordo com o tipo de dado que lhe está atribuído. Se tentarmos lê-lo como um unsigned int, obteremos um valor positivo obtido pela mesma lógica do overflow/underflow; se o lermos como um (signed) int, obteremos o mesmo valor negativo que lhe atribuímos.

Converter um tipo de variável

A conversão de uma variável consiste em converter o tipo de uma variável em um outro. Imagine que você esteja trabalhando com uma variável do tipo float e por alguma razão queira eliminar os números que estão depois da vírgula.

Esta operação pode ser realizada de duas maneiras.
Conversões do tipo implícita: Consiste em uma modificação do tipo de variável que é feita automaticamente pelo compilador.

Ex:

     int x;
     x = 7.123;

Conversões do tipo explícita: Também chamada de operação cast, consiste em forçar a modificação do tipo de variável usando o operador cast "( )".

Ex:

    int y;
    y = (int)7.123;

Veja um exemplo da conversão de tipo inteiro em caracteres. Aqui convertemos um número decimal em um caractere ASCII.

 
 #include <stdio.h>

  int main()
{
   int y = 65; 
   char x;

   x = (char) y;
   printf("O numero inteiro: %d \n O caractere: %c \n\n", y, x);
   return 0;
 }

Literais

Em programação, um literal é uma notação que representa um valor constante. Exemplos de literais em C são 415, 19.52, 'C', "João". Esses exemplos representam os quatro tipos de literais em C: literais de inteiros, literais de reais, literais de caracteres e literais de strings. Só com esses exemplos já é possível deduzir como se usam os literais; mas é importante fazer algumas observações:

Literais de inteiros podem ser especificados nas bases decimal, octal ou hexadecimal. Se o literal for prefixado com "0x" ou "0X", ele será interpretado como hexadecimal; se o prefixo for apenas "0", será interpretado como octal; ou se não houver prefixo, será interpretado como decimal.
Literais de reais podem ser especificados na forma decimal (144.57) ou em notação científica (1.4457e+2). Lembre-se que o separador decimal é o ponto e não a vírgula, como seria usual.
Literais de caracteres devem vir entre aspas simples (') e conter a representação de apenas um caractere¹. Usos válidos seriam: 'c', '\n', '\x1b', '\033'. Se você quiser usar a aspa simples como caractere, preceda-a com uma barra invertida: '\''.
Literais de strings devem vir entre aspas duplas ("). Para usar aspas duplas dentro de strings, preceda-as com barra invertida: "Ele disse \"Olá\".". Note que um literal de string adiciona o caractere nulo (\0) ao final da string, pois ele é, em C, a maneira de delimitar o final de uma string.

Na verdade, segundo o padrão C, literais de caracteres podem conter a representação de mais um caractere, mas o uso deles seria para representar números e não sequências de caracteres; é um aspecto pouco utilizado da linguagem C.