SDA Lucrarea 6
În acest laborator se vor implementa structuri de date asociative (map) cu arbori binari și funcții hash.
Structura de date asociativă - Map
Structura de date asociativă (map) este o structură de date abstractă care stochează perechi de elemente cheie-valoare, într-o ordine arbitrară stabilită de structură, astfel încât nu pot exista două perechi cu aceeași cheie în map.
În esență, un map este o mulțime (set) de chei care sunt întotdeauna stocate împreună cu o valoare.
Map-ul are următoarele proprietăți:
- Datele sunt plasate într-o ordine oarecare stabilită arbitrar de structură.
- Numărul de elemente ce poate fi stocat de structură este nelimitat.
- Elementele stocate în map sunt de același fel.
- Tipul de date al cheii și tipul de date al valorii pot fi diferite.
- Map-ul poate conține doar chei unice, în baza unei funcții definite de egalitate. Altfel spus, dacă două chei sunt egale din punctul de vedere al map-ului, ele nu pot fi ambele prezente în perechi cheie-valoare în map.
Map-ul suportă următoarele operații de bază:
- Interogarea numărului de elemente din map.
- Verificarea dacă map-ul este gol.
- Adăugarea perechi cheie-valoare (insert) - dacă cheia există deja în map, aceasta nu se înlocuiește.
- Verificarea dacă o cheie există în map (count).
- Căutarea unei valori după o cheie dată (at);
- Eliminarea unei chei din map (erase).
Implementarea de structuri asociative cu funcții hash
Definirea funcțiilor hash și a proprietăților lor s-a făcut în laboratorul 5 (SDA Lucrarea 5#Implementarea de mulțimi cu funcții hash).
Tipul de date și funcțiile de bază
În continuare vom prezenta un exemplu de map de la CNP (cheia) la elemente de tip Person
(valoarea), implementată cu funcții hash. În primul rând vom defini structura ce memorează datele legate de o persoană:
struct Person {
std::string firstName;
std::string lastName;
std::string idNumber; // seria si numarul de buletin
std::string address;
std::string birthday;
std::string cnp;
};
Funcțiile de hash și de egalitate pentru clasa std::string
sunt deja implementate în STL. Dacă totuși aveți nevoie de a folosi niste funcții proprii, acestea se scriu în același fel ca cele pentru mulțimi împlementate cu funcții hash (vezi SDA Lucrarea 5).
Clasa std::unordered_map
Pentru stocarea datelor necesare map-ului, În STL se definește clasa std::unordered_map
în header-ul unordered_map
. Aceasta este o clasă de tip template care se parametrizează cu două tipuri de date: tipul pentru cheie și tipul pentru valoare:
#include <unordered_map>
#include <string>
int main() {
std::unorder_map<std::string, Person> myMap; // un map de la string la Person
return 0;
}
Crearea unui std::unordered_map
Pentru crearea unui std::unordered_map
, se definește următorul constructor:
/**
* Constructorul creeaza un map nou și inițializează structurile de date interne.
*/
unordered_map();
Exemplu:
#include <unordered_map>
#include <string>
int main() {
std::unorder_map<std::string, Person> myMap;
Person person;
myMap["190010112345"] = person;
return 0;
}
Interogarea numărului de elemente din map
Pentru interogarea numărului de elemente din map se definesc:
/**
* Metoda intoarce numarul de elemente din map.
* @return numarul de elemente din map.
*/
uint64_t size();
/**
* Metoda intoarce true dacă map-ul nu conține nici un element.
* @return true dacă map-ul este gol, false în rest.
*/
bool empty();
Exemplu:
#include <unordered_map>
#include <string>
#include <cstdio>
int main() {
std::unorder_map<std::string, Person> myMap;
Person person;
myMap["190010112345"] = person;
printf("Map-ul contine %lu elemente.\n", myMap.size());
printf("Map-ul %s este gol!\n", myMap.empty() ? "" : "NU");
return 0;
}
Adăugarea unei perechi cheie-valoare în map
Pentru operația de adăugare se definesc următoarele metode:
/**
* Metoda adauga perechea data in map daca cheia nu exista.
* @param keyValuePair o pereche cheie-valoare
* @return o pereche iterator-bool, unde iteratorul identifică perechea
* introdusă în map, sau cea existentă cu aceeași cheie, iar bool spune daca
* perechea a fost introdusa sau nu (pentru ca exista deja).
*/
pair<iterator, bool> insert(pair<K, V> keyValuePair);
/**
* Metoda ia ca argument o cheie și intoarce o referinta (LVALUE) la
* valoarea asociată. Dacă cheia nu există în map, se adaugă cu o valoare
* neutră.
* @param key cheia ce se dorește adăugată (sau interogată).
* @return o referință la valoarea asociată cheii.
*/
V & operator[](K key);
Exemplu:
#include <unordered_map>
#include <string>
#include <cstdio>
int main() {
std::unorder_map<std::string, Person> myMap;
Person person;
myMap.insert({"191010112345", person});
myMap["190010112345"] = person;
printf("Map-ul contine %lu elemente.\n", myMap.size());
printf("Map-ul %s este gol!\n", myMap.empty() ? "" : "NU");
return 0;
}
Eliminarea unei chei din map
Pentru operația de eliminare se definește următoarea funcție:
/**
* Functia elimina cheia data din map daca acesta exista. Daca
* nu exista, functia nu are nici un efect.
* @param map map-ul din care trebuie eliminat elementul.
* @param key cheia (CNP-ul) ce trebuie eliminata.
*/
void hashMapRemove(struct HashMap * map, char * key);
Eliminarea se realizează în felul următor:
- Se aplică funcția hash pe variabila
key
. - Folosind valoarea obținută se accesează lista de pe poziția hash-ului din
array
. - Se folosește funcția
linkedListSearch
pentru a verifica dacăperson
există în listă. - Dacă valoarea întoarsă este diferită de -1 atunci se folosește funcția
linkedListDelete
pentru a șterge elementul de pe poziția respectivă și size se decrementează cu 1.
- Complexitate în timp: O(1) best case (fără coliziuni), O(1) average case pentru număr mai mic de 1000000 de persoane, O(n) worst case (același hash pentru poate persoanele).
- Complexitate în spațiu: O(1)
Verificarea dacă o cheie există în map
Pentru a verifica dacă o cheie există în map, se definește următoarea funcție:
/**
* Functia intoarce 1 daca cheia specificata exista in map.
* @param map map-ul in care se cauta cheia.
* @param key cheia (CNP-ul) cautata.
* @return 1 daca cheia exista in map, 0 daca nu.
*/
char hashMapHasKey(struct HashMap * map, char * key);
Verificarea unei chei dacă este sau nu în map se realizează în felul următor:
- Se aplică funcția hash pe variabila
key
. - Folosind valoarea obținută se accesează lista de pe poziția hash-ului din
array
. - Se folosește funcția
linkedListSearch
pentru a verifica dacăkey
există în listă. - Dacă valoarea întoarsă este diferită de -1 atunci se întoarce 1, altfel se întoarce 0.
- Complexitate în timp: O(1) best case (fără coliziuni), O(1) average case pentru număr mai mic de 1000000 de persoane, O(n) worst case (același hash pentru poate persoanele).
- Complexitate în spațiu: O(1)
Căutarea unei valori după cheie
Pentru a căuta o valoare după cheie, se definește urmtoarea funcție:
/**
* Functia intoarce valoarea asociată cheii key.
* @param map map-ul in care se cauta cheia.
* @param key cheia (CNP-ul) cautata.
* @return valoarea asociată cheii.
*/
struct Person hashMapGet(struct HashMap * map, char * key);
Căutarea unei valori după cheie se realizează în felul următor:
- Se aplică funcția hash pe variabila
key
. - Folosind valoarea obținută se accesează lista de pe poziția hash-ului din
array
. - Se iterează peste nodurile din listă și se caută cheia folosind funcția
equals
. - Dacă cheia a fost găsită, se întoarce valoarea asociată; dacă s-a ajuns la sfârșitul listei fără a se găsi cheia, se întoarce o structură de tip
Person
, indiferent cu ce valori (comportament nedefinit).
- Complexitate în timp: O(1) best case (fără coliziuni), O(1) average case pentru număr mai mic de 1000000 de persoane, O(n) worst case (același hash pentru poate persoanele).
- Complexitate în spațiu: O(1)
Ștergerea unui HashMap
Pentru dezalocarea unui HashMap
, se definește următoarea funcție:
/**
* Functia sterge hash map-ul specificat.
* @param map hash map-ul ce trebuie sters.
*/
void deleteHashMap(struct HashMap * map);
Pentru ștergerea unui HashMap
se urmează următorii pași:
- Se iterează peste tot
array
-ul, ștergându-se toate nodurile din toate listele. - Se șterge memoria alocată pentru structura de tip
HashMap
.
- Complexitate în timp: O(MAX_HASH)
- Complexitate în spațiu: O(1)