PC Laborator 12

De la WikiLabs
Jump to navigationJump to search

Obiective

La sfârșitul acestui laborator studenții vor fi capabili:

  • să definească și să utilizeze tipuri de date pointer;
  • să folosească pointeri pentru a putea modifica variabilele trimise ca argumente unor funcții;
  • să aloce, să folosească și să elibereze memorie HEAP, în mod dinamic;
  • să utilizeze aritmetica pointerilor pentru a itera peste elemente de la adrese consecutive de memorie;
  • să utilizeze valgrind pentru a diagnostica pierderile de memorie.

Tipuri de date pointer

Un pointer reprezintă o variabilă care stochează o adresă în memoria dedicată aplicației. Tipul variabilei de tip pointer specifică tipul datei care poate fi citit de la adresa respectivă.

O variabilă de tip pointer se definește în felul următor:

<tip_data> * <nume_variabila>;

Spre exemplu:

int * pa;

Variabila de tip pointer pa nu memorează un întreg, ci o adresă în memorie, iar de la adresa respectivă se poate citi un întreg. Acest lucru se numește indirectare simplă. În plus, deoarece tipul pointer este în sine un tip de dată, și în definiția unui pointer <tip_data> poate fi un pointer, aceasta permite următoarele construcții:

  • int * pa; - variabilă ce stochează o adresă de unde se poate citi un întreg (indirectare simplă);
  • int ** pa; - variabilă ce stochează o adresă de unde se poate citi o adresă de unde se poate citi un întreg (dublă indirectare);
  • int *** pa; - variabilă ce stochează o adresă de unde se poate citi o adresă de unde se poate citi o adresă de unde se poate citi un întreg (triplă indirectare);
  • etc.
Regulă: Orice variabilă este stocată în memorie și deci are o adresă în memorie.

În C există un tip de dată pointer care poate memora o adresă fără a știi ce date se află la adresa respectivă. Acest tip de pointer este void*.

Dimensiunea tipului de date pointer

Conform regulii de mai sus, și variabilele de tip pointer ocupă loc în memorie, deci au dimensiune, în octeți. Un pointer nu oferă informații legate de dimensiunea ocupată de datele de la adresa respectivă, ci doar adresa de unde începe zona ocupată. Din moment ce un pointer memorează doar o adresă, dimensiunea variabilelor de tip pointer nu depinde decât de dimensiunea spațiului de memorie. Astfel, pentru procesoare și sisteme de operare pe 32 de biți, o variabilă de tip pointer va avea 32 de biți, iar pe procesoare și sisteme de operare pe 64 de biți, o variabilă de tip pointer va avea 64 de biți.

Adresa unei variabile

Operatorul care permite aflarea adresei unde este stocată o variabilă este ampersand (&). Acesta este un operator unar ce se plasează înaintea unei variabile iar rezultatul evaluării sale este adresa unde este stocată variabila respectivă. Această adresă poate fi stocată într-o altă variabilă de tipul corespunzător. Altfel spus, pentru o variabilă de tip tip_data, adresa acesteia se poate stoca într-o variabilă de tip tip_data *:

float floatValue;
float * floatAddress = &floatValue;

int intValue;
int * intAddress = &intValue;
int ** intPointerAddress = &intAddress;

Adresa NULL

Pentru orice aplicație, adresa 0 din spațiul ei de memorie este rezervată. Aceasta nu poate fi nici scrisă și nici citită. Această adresa poartă numele de NULL. Orice variabilă de tip pointer poate lua valoarea NULL, lucru care de obicei specifică faptul că de fapt variabila pointer nu stochează o adresă validă.

Constanta NULL este definită în fișierul header stdlib.h (Standard Library).
#include <stdlib.h>

int main() {
    char * charPointer = NULL;
    return 0;
}

Valoarea de la o adresă

Având o variabilă de tip pointer, valoarea stocată în memorie la adresa respectivă se poate afla folosind caracterul steluță (*), numit și operator de indirectare. Acesta este un operator unar ce se plasează înaintea unei variabile de tip pointer iar rezultatul evaluării sale este valoarea din memorie de la adresa stocată în variabila respectivă. Această valoare poate fi stocată într-o altă variabilă de tipul corespunzător. Altfel spus, pentru o variabilă pointer de tip tip_data *, valoarea de la adresa stocată de pointerul respectiv se poate memora într-o altă variabilă de tip tip_data:

float floatValue;
float * floatAddress = &floatValue;
float anotherFloatValue = *floatAddress;

int intValue;
int * intAddress = &intValue;
int ** intPointerAddress = &intAddress;
int * anotherintAddress = *intPointerAddress;


Atenție: Accesarea valorii de la o adresă se numește dereferențiere. Dereferențierea unei adrese care nu face parte din spațiul de memorie al aplicației sau dereferențierea lui NULL va avea ca efect oprirea imediată a programului printr-un Segmentation fault.
Atenție: Nu confundați steluța utilizată la definirea unui pointer cu operatorul de indirectare/ dereferențiere. Aceștia sunt la fel de diferiți cum este și operatorul de inmulțire față de cel de indirectare.

Utilitatea variabilelor de tip pointer

Pointerii în C au două roluri foarte importante:

  1. Alocarea dinamică de memorie în HEAP
  2. Modificarea variabilelor parametri ale unor funcții astfel încât modificarea să se păstreze în afara funcției

Alocarea dinamică de memorie

Memoria alocată unei aplicații de către sistemul de operare este împărțită în mai multe secțiuni, din care importante pentru stocarea de date sunt:

  • Segmentele BSS și Data - reprezintă memoria alocată pentru variabilele statice (globale), care există de la începutul până la încheierea programului, fără posibilitate de eliberare;
  • Stiva (Stack) - zona de memorie în care se alocă contextele funcțiilor apelate în timpul execuției programului și în care se alocă argumentele și variabilele locale are funcțiilor; această zonă este alocată la intrarea în funcție și este eliberată la ieșirea din funcție;
  • HEAP - zonă de memorie în care se pot aloca dinamic, de către programator, blocuri de memorie ce pot fi folosite în program până la eliberarea acestora de către programator.

Alocarea și dezalocarea memoriei în heap se face folosind următoarele funcții:

  • void * malloc(unsigned size) - alocă size octeți într-o zonă continuă din HEAP și întoarce adresa de memorie unde începe zona respectivă; dacă alocarea eșuează (nu exită suficientă memorie într-o zonă continuă în HEAP), funcția va întoarce NULL; alocarea nu șterge conținutul memoriei respective;
  • void * calloc(unsigned elements, unsigned elementSize) - alocă elements elemente de elementSize octeți fiecare într-o zonă continuă din HEAP și întoarce adresa de memorie unde începe zona respectivă; dacă alocarea eșuează (nu exită suficientă memorie într-o zonă continuă în HEAP), funcția va întoarce NULL; alocarea șterge tot conținutul memoriei respective, scriind 0 la fiecare locație;
  • void free (void *) - dezalocă o zonă de memorie alocată în prealabil cu malloc sau calloc; apelul succesiv de două sau mai multe ori a funcției free pentru aceeași zonă de memorie sau apelul ei pentru o adresă care nu a fost alocată în prealabil va avea ca efect oprirea imediată a programului cu eroare (double free or corruption).

Toate aceste funcții sunt definite în fișierul header stdlib.h.

#include <stdlib.h>
#include <stdio.h>

int main(){
    int * intPointer;
    short * shortPointer;

    intPointer = (int*) malloc(sizeof(int));
    shortPointer = (short*) calloc(1, sizeof(short));

    printf("Valoarea din zona alocata pentru int este: %d\n", *intPointer);
    printf("Valoarea din zona alocata pentru short este: %hd\n", *shortPointer);

    free(intPointer);
    free(shortPointer);

    return 0;
}
Atenție: Deoarece funcțiile malloc și calloc au doar rolul de a aloca memorie, fără să știe care este scopul utilizării acestei memorii, ele întorc un pointer de tip void *. Astfel, pentru a putea stoca adresa într-un alt tip de pointer (de exemplu int *), ea trebuie convertită la tipul de date corect. Aceasta este explicația prezenței operatorului de cast din fața apelului funcțiilor malloc și calloc din codul de mai sus.

Aritmetica pointerilor

Când se alocă memorie in HEAP, rareori se alocă pentru un singur element, de cele mai multe ori se alocă pentru un număr mare de elemente de același fel. Ca exemplu, dacă vrem să stocăm o imagine High Definition, ne trebuie o zonă de memorie care să poată memora informație de culoare pentru 1920 * 1080 de pixeli, fiecare pixel având informație de culoare pentru roșu, verde și albastru (RGB). Fiecare din aceste componente de culoare se stochează pe un octet ca valoare întreagă fără semn (unsigned char). Prin urmare pentru un frame se vor aloca 1920 * 1080 * 3 octeți = 6220800, aproape 6 MB. Această memorie se alocă întotdeauna într-o zonă continuă de către funcțiile malloc și calloc:

#include <stdlib.h>
int main(){
    unsigned char * frame;
    frame = (unsigned char*) malloc(1920 * 1080 * 3 * sizeof(unsigned char));
    //... use frame

    free (frame);
    return 0;
}

Deoarece pointer-ul nu memorează decât adresa de început a zonei de memorie, există posibilitatea de a modifica adresa pentru a accesa elementele ulterioare. În acest scop, variabilele de tip pointer suportă doar operații aritmetice de adunare sau scădere, nu și de înmulțire sau împărțire.

Atenție: Incrementarea unui pointer nu crește adresa cu 1, ci cu dimensiunea tipului de dată al pointer-ului. Deci pentru un int * p;, linia p++; va incrementa adresa cu 4 (sizeof(int)):
#include <stdio.h>
#include <stdlib.h>

int main(){
    int * pointer;
    pointer = (int*) malloc(10 * sizeof(int));
    printf("The pointer address is: %p\n", pointer);
    printf("The pointer address + 1 is: %p\n", pointer + 1);
    free (pointer);
    return 0;
}
Atenție ca prin operații pe pointeri să nu depășiți zona de memorie alocată.

Adrese ca argumente de funcție

Pointerii și vectorii

Memoria alocată pentru mai multe elemente de același fel reprezintă de fapt un vector de elemente de acel tip. Astfel aflăm că de fapt vectorii și pointerii, în multe situații se pot folosi interschimbabil.

Când se definește un vector, numele vectorului reprezintă un pointer la adresa de unde începe zona lui de memorie, adică adresa unde este memorat elementul de la indexul 0:
#include <stdio.h>
#include <stdlib.h>

int main(){
    int array[10];
    array[0] = 13;
    printf("The array pointer address is: %p\n", array);
    printf("The value at address %p is %d\n", array, *array);
    return 0;
}
Dereferențierea unui pointer indexat cu o valoare este echivalentă cu folosirea operatorului de acces la vector: *(v + k) == v[k], unde v este un pointer (sau vector) iar k este un întreg.
#include <stdlib.h>
#include <stdio.h>
int main(){
    int arraySize;
    printf("size = ");
    scanf("%d", &arraySize);

    int * heapArray;
    heapArray = (int*) malloc(arraySize * sizeof(int));

    int i;
    for(i = 0; i < arraySize; i++) {
        printf("heapArray[%d] = ", i);
        scanf("%d", &heapArray[i]);
    }

    for(i = 0; i < arraySize; i++) {
        printf("heapArray[%d] = %d\n", i, heapArray[i]);
    }


    free (heapArray);
    return 0;
}