Kandidaadivõti on atribuutide kombinatsioon, mis tuvastab unikaalselt andmebaasikirje ilma muudele andmetele viitamata. Igal laual võib olla üks või mitu kandidaati. Üks neist kandidaatvõtmetest on valitud tabeli primaarvõtmeks. Tabel sisaldab ainult ühte primaarvõtit, kuid see võib sisaldada mitut kandidaatvõtit. Kui kandidaatvõti koosneb kahest või enamast veerust, nimetatakse seda liitvõtmeks.
Kandidaadivõtme omadused
Kõigil kandidaatvõtmetel on mõned ühised omadused. Üks omadusi on see, et kandidaatvõtme eluea jooksul peab tuvastamiseks kasutatav atribuut jääma samaks. Teine on see, et väärtus ei saa olla null. Lõpuks peab kandidaadivõti olema kordumatu.
Näiteks iga töötaja konkreetseks ja kordumatuks tuvastamiseks võib ettevõte kasutada töötaja sotsiaalkindlustuse numbrit. Mõnel inimesel on sama eesnimi, perekonnanimi ja ametikoht, kuid kaks inimest ei kasuta sama sotsiaalkindlustusnumbrit.
Sotsiaalkindlustusnumber | Eesnimi | Perekonnanimi | Positsioon |
---|---|---|---|
123-45-6780 | Craig | Jones | Juhataja |
234-56-7890 | Craig | Beal | Associate |
345-67-8900 | Sandra | Beal | Juhataja |
456-78-9010 | Trina | Jones | Associate |
567-89-0120 | Sandra | Smith | Associate |
Kandidaadivõtmete näited
Mõnda tüüpi andmed sobivad kergesti kandidaatidena:
- Rahvusvahelised standardsed raamatunumbrid: ISBN-id tuvastavad unikaalselt raamatud ja nendega seotud meedia. ISBN-ide väljaandmist reguleerivad rangelt valdkonna väravavahid ja kirjastajad ei kasuta ISBN-e kunagi uuesti.
- Pangakontonumbrid: Enamik panku ei võta kontonumbreid ümber.
- Seerianumbrid: kuigi seerianumbreid ei reguleerita erinevates tööstusharudes, peaks seerianumber ühe tarnija kontekstis alati olema kordumatu.
- Juhilubade numbrid: Tavaliselt neid numbreid ei dubleerita. Osariigist osariiki liikuval inimesel võib aga olla rohkem kui üks DL-number.
- Riikliku teenusepakkuja ID: arstidel ja teistel litsentseeritud meditsiiniteenuste osutajatel on igaühel vähem alt üks neile ainulaadne NPI, mille on välja andnud USA tervishoiu- ja inimteenuste osakond.
Mõnda tüüpi teave, mis võib tunduda heade kandidaatidena, osutub aga tegelikult problemaatiliseks:
- Telefoninumbrid: enamik operaatoreid taaskasutab telefoninumbreid ja üksikud abonendid saavad kasutada korraga mitut telefoninumbrit.
- Universaalsed hinnakoodid: UPC-d on ainulaadsed, kuid UPC-ploki omanik võib tooteid oma äranägemise järgi taaskasutada.
- Meditsiiniliste andmete numbrid: MRN-id väljastatakse tavaliselt haigla tasandil, ilma igasuguste riiklike juhisteta nende identifikaatorite struktuuri ja vormingu kohta.
- Sotsiaalkindlustusnumbrid: kuigi need on teoreetiliselt ainulaadsed, võetakse SSN-id ringlusse ja SSN-i pettus on piisav alt levinud, et muuta see identifikaator suurte andmekogumite puhul problemaatiliseks. (SSN-e kontrolliva tööandja kontekstis pole see väljakutse probleem.)