Semi Join vs Bloom Join
Semi join ja Bloom join ovat kaksi yhdistämismenetelmää, joita käytetään hajautettujen tietokantojen kyselyjen käsittelyssä. Kun käsitellään kyselyitä hajautetuissa tietokannoissa, tiedot on siirrettävä eri sivustoissa sijaitsevien tietokantojen välillä. Tämä voi olla kallis toimenpide riippuen siirrettävän tiedon määrästä. Siksi käsiteltäessä kyselyitä hajautetussa tietokantaympäristössä on tärkeää optimoida kyselyt sivustojen välisen tiedonsiirron minimoimiseksi. Semi join ja bloom join ovat kaksi menetelmää, joita voidaan käyttää vähentämään tiedonsiirtoa ja suorittamaan kyselyjen tehokas käsittely.
Mikä on Semi Join?
Semi join on menetelmä, jota käytetään tehokkaaseen kyselyjen käsittelyyn hajautetuissa tietokantaympäristöissä. Tarkastellaan tilannetta, jossa työntekijän tietokanta (jolla on tietoja, kuten työntekijän nimi, osaston numero, jossa hän työskentelee, jne.) Sijaitsee paikassa 1 ja osastotietokanta (jolla on tietoja, kuten osaston numero, osaston nimi, sijainti jne.) 2. Jos esimerkiksi haluamme saada työntekijän nimen ja osaston nimen, jonka parissa hän työskentelee (vain”New Yorkissa” sijaitsevien osastojen kohdalla), suorittamalla kysely paikassa 3 sijaitsevassa kyselyprosessorissa on useita tapoja, joilla tietoja voidaan siirtää kolmen sivuston välillä tämän tehtävän saavuttamiseksi. Mutta tietoja siirrettäessä on tärkeää huomata, että koko tietokantaa ei tarvitse siirtää sivustojen välillä. Vain osa liitokseen tarvittavista määritteistä (tai joukkoista) on siirrettävä sivustojen välillä, jotta kysely voidaan suorittaa tehokkaasti. Semi join on menetelmä, jolla voidaan vähentää sivustojen välillä toimitettavien tietojen määrää. Puoliliitännässä vain liitospylväs siirretään paikasta toiseen ja sitten siirrettyä saraketta käytetään pienentämään muiden sivustojen välisten lähetettyjen suhteiden kokoa. Yllä olevassa esimerkissä voit vain siirtää laitosnumeron ja osastojen nimen, joiden sijainti on”New York”, paikasta 2 sivustoon 1, suorittaa liittäminen paikassa 1 ja siirtää lopullinen suhde takaisin sivustoon 3.vain liittymispylväs siirretään paikasta toiseen ja sitten siirrettyä saraketta käytetään pienentämään muiden sivustojen välisten lähetettyjen suhteiden kokoa. Yllä olevassa esimerkissä voit vain siirtää osastojen numeron ja osastojen nimet, joiden sijainti =”New York” on paikasta 2 sivustoon 1, suorittaa liitos työmaalla 1 ja siirtää lopullinen suhde takaisin sivustoon 3.vain liittymispylväs siirretään paikasta toiseen ja sitten siirrettyä saraketta käytetään pienentämään muiden sivustojen välisten lähetettyjen suhteiden kokoa. Yllä olevassa esimerkissä voit vain siirtää laitosnumeron ja osastojen nimen, joiden sijainti on”New York”, paikasta 2 sivustoon 1, suorittaa liittäminen paikassa 1 ja siirtää lopullinen suhde takaisin sivustoon 3.
Mikä on Bloom Join?
Kuten aiemmin mainittiin, bloom join on toinen menetelmä, jota käytetään välttämään tarpeettoman tiedon siirtämistä sivustojen välillä, kun suoritetaan kyselyitä hajautetuissa tietokantaympäristöissä. Kukintaliitoksella liitospylvään itsensä siirtämisen sijaan kompakti esitys sarakkeesta siirretään paikkojen välillä. Bloom join käyttää kukintasuodatinta, joka käyttää bittivektoria jäsenkyselyjen suorittamiseen. Ensinnäkin kukintasuodatin rakennetaan liitospylvään avulla ja se siirretään paikkojen välillä ja sitten suoritetaan liitosoperaatiot.
Mitä eroa on Semi Join ja Bloom Join?
Vaikka sekä puoliliitäntä- että kukkaliitosmenetelmiä käytetään minimoimaan sivustojen välillä siirrettävän datan määrä, kun suoritetaan kyselyitä hajautetussa tietokantaympäristössä, kukkapakettiliitos vähentää siirrettävän datan määrää (sarakkeiden lukumäärä) verrattuna puoliliitokseen hyödyntämällä käsite kukintasuodattimista, jotka käyttävät bittivektoria määrittämään asetetut jäsenyydet. Siksi kukkaliitoksen käyttö on tehokkaampaa kuin puoliliitoksen käyttö.