QdJoer – Poll omtrent Google’s Harde Schijf

Quote du Jour
Gebruikers willen software en documenten graag zowel online als offline gebruiken. Ze voelen zich simpelweg niet veilig bij het volledig uit handen geven van dit soort informatie. We hebben zeer veel tijd gestoken in het onderzoek naar wat de consument vertrouwen geeft en hebben ontdekt dat het voor hen op dit moment niet wenselijk is om alle gegevens online te bewaren.”

Aan het woord is Microsofts Vice president Chris Capossela. Als steeds reageren de heren daar zenuwachtig op Google’s behoorlijk aanwezige politiek binnen de internets.
Wat denkt u (als u althans nog zelf kàn denken): is opslaan op een collectieve harde schijf aantrekkelijk of afschuwelijk?

Poll McCartney: stemtijd!!
[poll=105]

  1. 2

    MS zelf heeft al een heel aardige oplossing voor portable data op de markt: een echte werkplek op kantoor met Office, en een soort virtuele Officewerkplek over internet met de gegevens die je ook op de zaak gebruikt. Werkt goed.

  2. 7

    Niets van dattum:

    Het is handig om bepaalde bestanden online te hebben en wat je niet wilt dat google weet houd je lekker lokaal. verder is er altijd nog encryptie met een handige sleutel op een usb stokje aan …. juist je sleutelbos!

  3. 8

    Niets van dattum: Ik zorg wel voor mijn eigen opslag…

    Maar wel leuk natuurlijk om eens in de shit van een ander, die wel zo stom was zijn data aan The Borg te doneren, te neuzen…

  4. 16

    Ik snappernietsvan! Als je je data wereldwijd wilt gebruiken, koop je toch een energiezuinig pc’tje (als je echt stoer wilt doen een VIA EPIA pico-ATX, die kun je zelfs verstoppen in de kast van je “gewone computer” en verbruikt minder energie dan een spaarlamp) en maakt daar een fileservertje van?

  5. 17

    @Bismarck:

    Is een beetje veel moeite voor de gemiddelde computeraar medunkt. Mogelijk is een NAS drive dan een uitkomst. Een pico-ATX lijkt mij persoonlijk wat overpowered voor een fileserver.

  6. 18

    @17: Nauwelijks lijkt me. Draaien maximaal op 1 GHz zover ik me herinner. Je kan ze natuurlijk nog onderklokken om meer energie te sparen.

    Je kan ook je gewone PC aan laten staan en er een fileserver op draaien. Is alleen wat minder zuinig. Al is er wel veel te winnen in zaken als C’nQ en andere energie-besparende software. Momenteel doe ik het met een A64 mini-ATX systeempje, dat ik met een programmaatje op 800MHz en een lager voltage zet, tenzij ik er iets mee doe.

    Excuses voor de nerd-off topic, maar aangezien de vorige generatie PC’s tegenwoordig voor dumpprijzen 2e-hands te bemachtigen zijn, lijkt me dat best een alternatief voor de doorsneegebruiker wiens privacy hem een euro of 100 waard is. De programmatuur voor FTP-servers en zelfs webservers is tegenwoordig ook gebruiksvriendelijk genoeg voor redelijke amateurs.

  7. 20

    Grijs zwart wit. Voor sommige dingen handig, voor delicate dingen te wantrouwen.

    Economisch gezien wel handig (bv. met collega’s projectdocumenten delen zonder dat je de hele tijd moet mailen en saven en openen en RSI krijgt) … en niet zonder betekenis. Om te beginnen omdat er minder markt overblijft voor websitefirmaatjes en developers, omdat er nu eindelijk een reeks sites-met-handige-toepassingen-ja-zelfs-applicaties zijn “die de standaard stellen” op een manier dat je je afvraagt “waarom het nog moeilijker maken”. Gaan we naar het equivalent van slagers die in loondienst gaan bij de vleesafdeling een supermarkt ?

    Of neem nu vrije markt & het recht op mededinging bij overheidsaanbestedingen. Terwijl steeds meer persoonlijke sites het blogmodel gebruiken, terwijl steeds meer individuen hun harde schijf meer voor zichzelf bewaren en de rest toevertrouwen aan 2.0 sites die door anderen worden gerund, enz. … vinden dat soort handige 2.0 dingen ook ingang bij overheden. Via de ambtenaren die ze in hun privé-leven gebruiken, en die zich afvragen “waarom niet hier op ons werk gelijkaardig te werk gaan”. En dan rijzen er deontologische vragen. Moet je bv. als overheid je eigen fotosite maken voor werkprojecten, met alle ontwikkelings- en vergaderingskosten vandien, of kun je gewoon Flickr gebruiken, of ga je wie weet zelfs een ‘joint venture’ of pps-samenwerking aan met Flickr, of … Wat kan / mag, wat is deontologisch, wat is aan te besteden, wat is indirect niet zo kosher als het lijkt, enz. ?

    Fire away !

  8. 21

    Aanvullend : zie ook dat diskgate schandaal in the UK. Of die verloren gegane diskettes van de Nederlandse staatsveiligheid of het NL leger. Tot op welke hoogte mag een overheid dan gebruik maken van Google docs of andere sites waarvan je niet goed kan inschatten wat “password protected” waard is.

  9. 23

    Als je unecrypted belangrijke data op je google diskje zet ben je dom bezig natuurlijk.
    Ik denk wel dat het goed zal zijn voor de film/audio warez scene. rapidshare etc zijn vaak irritant.

  10. 25

    Het probleem van de huidige generatie databases is dat de beheerder van de database in principe toegang heeft tot de gegevens van alle gebruikers. Dit legt een veel te grote macht en verantwoordelijkheid bij het beheer van databases die grote invloed hebben op het leven van burgers en ondernemingen.

    Idee:
    Bouw een open source database waarin voor elke gebruiker de data met een persoonlijke code en encryptiemethode wordt versleuteld. Dan krijgt de gebruiker zelf de sleutel in handen en is ie niet zo afhankelijk van de veiligheid op de database servers.

    Een iets uitgebreider verkenning van dit idee heb ik ter discussie op gathering.tweakers.net gezet.

  11. 26

    @Benoni:

    Volgens mij heeft dat weinig te maken met de implementatie van de database. Encryptie van gegevens zou ik eerder een laag hoger verwachtten in de applicatie. Het is vergelijkbaar met versleuteld informatie op een harde schijf, het is niet dat laatste wat voor de encryptielaag zorgt.

  12. 27

    @su

    Misschien heb ik ’t niet helemaal goed verwoord in de bovenstaande regels. Ik wil juist de encryptie layer helemaal van de database server afhalen. Want als de database server zelf de data kan decrypten, dan kan dat veel makkelijker uit het zicht van de controle van de gebruiker (of diens vertegenwoordiging) geschieden. De gegevens moeten in principe als onherkenbare chunks data worden aangeboden en opgevraagd.
    Als er daarbij op filesystem-niveau encryptie wordt toegepast geeft dat natuurlijk wel een extra barriëre die de ID’s beschermt waarmee de data is gerangschikt.

  13. 28

    @Benoni:

    De database zal op zijn minst de gegevens die relevant zijn voor queries moeten kunnen lezen. Dus volledige encryptie is niet mogelijk. Is het op filesystem niveau geregeld, dan zal de database de gegevens ongeencrypt moeten kunnen benaderen. Zaken die niet relevant zijn voor queries kunnen wel encrypt blijven, maar dat heeft niks met de database domein te maken.

  14. 29

    Ik kan het misschien beter zo uitleggen:

    Het idee is een soort van technische evenknie van een trias politica: Voor de toegang tot de gegevens zijn altijd drie partijen nodig.

    De eerste heeft de gegevens, de tweede heeft de programma’s om te decrypten en te indexeren, de derde beheert de sleutels en houdt toezicht. Voor elke functie is de software open source en is de markt open voor concurrentie. Alle software voorziet in logbestanden die door de gebruiker kunnen worden ingezien. De gebruiker is vrij om te kiezen bij wie de drie functies worden gehost, in het beste geval is dat bij onderling onafhankelijke organisaties. De gebruiker kan ook functes op eigen servers hosten, afhankelijk van de eisen die aan de beschikbaarheid worden gesteld.

  15. 30

    Maar wat heeft dat met databasetechnogie te maken? Ik zie het echt niet zitten om van twee andere partijen afhankelijk te zijn om een database te onderhouden. Ik heb het idee dat je nogal wat probleemdomeinen door elkaar gooit.

  16. 31

    Maar als ik alles bij één partij laat hosten, hoe kan ik er in dat geval van op aan dat mijn gegevens niet worden ontvreemd? Hooguit door zelf alles te versleutelen wat ik in de database zet. Maar dat is niet handig als je je data wilt delen met je collega’s op je bedrijf. Of denk groter: je wilt het idee opschalen naar een landelijk bruikbaar systeem waarmee o.a. overheden en zorginstellingen je persoonlijke gegevens kunnen opbergen (en terug kunnen vinden), maar dan zonder schandalen met rondslingerende informatiedragers en wachtwoorden. Daarom dus een systeem dat technisch zo is vormgegeven dat de deelnemende partijen elkaar doorlopend controleren, en waarbij de burger kan toezien hoe dat het wordt gebruikt… denk ik dan :-)

  17. 32

    Ja, maar dat is dus een laag hoger dan de database. Vergelijk het maar met de verhouding tussen TCP/IP en HTTP/HTTPS. De onderliggende TCP/IP laag heeft geen weet ervan dat de daarbovenop gelegen laag bestaat uit HTTP of HTTPS. Dat is ook niet nodig voor de transport van de gegevens. Belangrijker wordt het pas voor de interpreterende programma om te weten hoe de data verpakt is. Idem voor dit probleem. Dat de database gedeelde informatie encrypt opslaat interesseert hem niet zoveel, als de metadata nodig voor identificatie bereikbaar is, denk bijvoorbeeld aan een bestandsnaam. Dus het versleutelen ligt niet bij het domein van de database, of wat daaronder ligt. Waar je naar zoekt is een laag die encryptie en het in groepsverband delen van sleutels regelt, een ander domein dan het fysieke opslag dus.

  18. 33

    Inderdaad, ik probeer het zo goed mogelijk functioneel te scheiden. De functieverdeling en layer-verdeling zou echter voor een optimaal werkende oplossing wel door elkaar moeten lopen, en dat is ook meteen het lastigste onderdeel van het plan.

    Een ander toegang verlenen tot de gegevens is simpel, bijvoorbeeld op deze manier: je krijgt van de ander een token, die voeg je toe aan je persoonlijke contactenlijst met een aantal voorwaarden (lees- en schrijfrechten op datasets, leasetijd, gebruikslimiet), en op basis van die gegevens regelt het systeem de toegang.

    Maar om te kunnen zoeken in gegevens van grote groepen gebruikers zou een computer dan voor elke gebruiker door de authenticatie-procedure moeten, dat is in de praktijk niet schaalbaar. Bovendien zou in zo’n geval een beveiliging in werking kunnen cq. moeten treden tegen het grootschalig openen van dossiers.

    Om bij toepassingen op die schaal een dataprocessing-infarct te voorkomen zouden toch de indexerings-mogelijkheden die een database biedt op de een of andere manier wel gebruikt moeten worden. Maar dat is natuurlijk een belang tegengesteld aan het uitgangspunt: de waarborging van discrete data-opslag. Er moet dus een werkbare hybride oplossing worden gemaakt waarbij rekening wordt gehouden met hoe de gebruikers hun gegevens classificeren: openbare gegevens, gegevens die geanonimiseerde vorm mogen worden aangeboden, vertrouwelijke indexgegevens (exclusief uitgesplitst voor elk contact die gebruikers in hun toegangslijst hebben staan) en gegevens die niet worden geindexeerd. Dat moet ook nog eens op zo’n manier worden opgeslagen dat bij het ‘uitlekken’ van index-tabellen geen reconstructie kan worden gemaakt van de inhoud van een persoonlijke gegevensset. Of zoiets. Pfoeh!