files opslaan zonder zelfde naam.
ik ben bezig voor een media website,
en hierbij kunnen mensen files uploaden, ik weet alleen nog niet zo goed hoe ik deze files moet opslaan op mijn server zonder dubbelen file names,
ik zat zelf te denken aan iets van randid() of iets dergelijks en het zo op te slaan in mijn database als primary key om de file te vinden,
is dit een goede manier of is de kans dat ik dan een dubbele file krijg ook nog aanzienlijk groot?
alvast bedankt,
MVG Tim Ouwerkerk.
wat je jezelf even moet afvragen: stoort het jouw dat er files onder dezelfde naam staan? anders kun je een extra kolom toevoegen in je database, ID met auto-increment, en krijgt iedere file een ander ID, zelfs bij dezelfde naam. je hoeft die ID niet zelf te genereren, dat doet de database voor jou
Jeroen vd op 03/05/2012 17:07:29:
wat je jezelf even moet afvragen: stoort het jouw dat er files onder dezelfde naam staan?
Kun jij 2 files met dezelfde naam opslaan op een locatie?!?? :s
Doorgaans wordt geadviseerd om de bestandsnamen niet over te nemen, maar zelf toe te kennen/aan te passen. je zou hierbij kunnen werken met bv datum/tijd en desnoods een random-id.
Obelix en Idefix op 03/05/2012 17:57:58:
Kun jij 2 files met dezelfde naam opslaan op een locatie?!?? :s
yep. met een ID in de database
Jeroen vd op 03/05/2012 18:01:39:
yep. met een ID in de database
Obelix en Idefix op 03/05/2012 17:57:58:
Kun jij 2 files met dezelfde naam opslaan op een locatie?!?? :s
yep. met een ID in de database
Wat heeft database te maken met opslaan van de bestanden op de server???
Je kunt niet bestand1.jpg en bestand1.jpg in dezelfde directory op slaan... En anders mag je me uitleggen hoe.
Dus als jij als bestand upload test.jpg en ik daarna ook, dan kun jij beide bestanden met deze (zelfde) naam op de server plaatsen?
ooo zo. ik zou iig voor de gebruiker gewoon de naam die hij wil, en zelf (dmv die database ID) een unieke naam geven aan dat bestand. wanneer dat dan gedownload wordt, krijgt het weer de oude naam.
Overigens kun/mag/wil je sowieso nooit de originele bestandsnaam gebruiken want je weet niet wat een hacker allemaal voor onzin aan kan bieden. "index.php" geeft charmante effecten.
Omdat je zelf een naam moet verzinnen moet je ergens bijhouden wat de originele naam was en dus kom je uit op een database. Een sequence of een auto_increment kan heel makkelijk volledig unieke namen genereren. Vergeet niet de extentie en het mimetype op te slaan.
De bestanden zelf kun je in principe ook in de database zetten maar dan maak je ze wel minder toegankelijk als je b.v. foto's en films wilt embedden in html.
Jeroen vd op 03/05/2012 18:01:39:
yep. met een ID in de database
Obelix en Idefix op 03/05/2012 17:57:58:
Kun jij 2 files met dezelfde naam opslaan op een locatie?!?? :s
yep. met een ID in de database
2 bestanden met dezelfde naam (op locatie!) kan niet. De oude wordt simpelweg overschreven. In een DB worden geen bestanden opgeslagen, alleen paden naar die bestanden.
@TS:
Je kunt een simpele random nummer generator maken die een x cijferig nummer voor of achter de originele bestandsnaam zet voordat hij het opslaat. Zo voorkom je dubbele namen.
En om de namen dan eventueel kort te houden (als de naam niets hoeft te betekenen), kun je de naam ook nog
hashen en dan opslaan.
Met adler32, crc32 of crc32b krijg je een output van 8 karakters.
Dus als voorbeeld.
Originele naam: Afb001.jpg
Met random nummer: 492381739Afb001.jpg
Nadat de random nummer+naam is gehashed: 857d39f7.jpg
Gewijzigd op 04/05/2012 08:00:15 door Chris PHP
Opvallend hoe vaak mensen 'random' gebruiken, als ze iets unieks nodig hebben. Een random nummer hier toevoegen voegt niets functioneel toe en lost niets op. In elk geval in theorie heb je nog steeds hetzelfde probleem. De enige juiste oplossing wat mij betreft is het compleet vervangen van de naam door een uniek nummer. Gelukkig kan dat bijzonder eenvoudig met behulp van de auto increment van mysql. Elke keer dat er een bestand geupload wordt voer je een record in, lees je het id uit en vervang je de bestandsnaam. Waarom moeilijk doen als het gewoon zo makkelijk kan.
In mijn 'optie' wordt de complete naam vervangen, ik zie het probleem niet.
En 'random' kan random zijn en zo gemaakt worden dat het niet 2x dezelfde nummers genereerd.
ID's koppelen kan ook uiteraard, er zijn meer wegen die naar Rome leiden en ieder heeft zo z'n eigen voorkeur.
Hij kan ook alle uploads in een queue gooien en deze vervolgens eerst met de hand een andere naam geven.
Gewijzigd op 04/05/2012 08:38:34 door Chris PHP
Nee, de hele naam wordt niet vervangen, je voegt een random waarde toe. Daarmee behoud je de mogelijkheid dat je tweemaal dezelfde uitkomst krijgt. Voorbeeld:
Bestandsnaam: 1.jpg
Randomwaarde: 123
Bestandsnaam: 31.jpg
Randomwaarde: 12
Dit levert dezelfde uitkomst op in jouw manier. En het ergste hier is dat als dit gebeurt het eigenlijk nooit meer te traceren is. Het oude bestand verdwijnt gewoon.
En een random waarde alsmog uniek maken helpt hier ook niet. De waardes in het voorbeeld zijn uniek en toch levert het problemen op.
Dus nogmaals, gebruik iets unieks, niet random en vervang de hele bestandsnaam dan ben je direct van het hele probleem af.
Erwin H op 04/05/2012 09:06:26:
@chris
Nee, de hele naam wordt niet vervangen, je voegt een random waarde toe. Daarmee behoud je de mogelijkheid dat je tweemaal dezelfde uitkomst krijgt. Voorbeeld:
Bestandsnaam: 1.jpg
Randomwaarde: 123
Bestandsnaam: 31.jpg
Randomwaarde: 12
Dit levert dezelfde uitkomst op in jouw manier. En het ergste hier is dat als dit gebeurt het eigenlijk nooit meer te traceren is. Het oude bestand verdwijnt gewoon.
En een random waarde alsmog uniek maken helpt hier ook niet. De waardes in het voorbeeld zijn uniek en toch levert het problemen op.
Dus nogmaals, gebruik iets unieks, niet random en vervang de hele bestandsnaam dan ben je direct van het hele probleem af.
Nee, de hele naam wordt niet vervangen, je voegt een random waarde toe. Daarmee behoud je de mogelijkheid dat je tweemaal dezelfde uitkomst krijgt. Voorbeeld:
Bestandsnaam: 1.jpg
Randomwaarde: 123
Bestandsnaam: 31.jpg
Randomwaarde: 12
Dit levert dezelfde uitkomst op in jouw manier. En het ergste hier is dat als dit gebeurt het eigenlijk nooit meer te traceren is. Het oude bestand verdwijnt gewoon.
En een random waarde alsmog uniek maken helpt hier ook niet. De waardes in het voorbeeld zijn uniek en toch levert het problemen op.
Dus nogmaals, gebruik iets unieks, niet random en vervang de hele bestandsnaam dan ben je direct van het hele probleem af.
Uhmmm..... Waarom 'genereer' je eerst 3 cijfers en in e tweede voorbeeld maar 2 cijfers? Zo lust ik er ook nog wel een paar ja. Je kunt makkelijk een 'generator' schrijven die bijv. continu 8 random cijfers genereerd, en niet dan 3 dan 8 dan 1.
Om de kans nog kleiner te maken voor een dubbele genereer je 20 cijfers, want gelijk na de nieuwe gegenereerde naam (nummer+naam) hash je de naam en krijg je een unieke naam van 8 karakters.
Uiteraard kan je het allemaal anders doen.... maar het enige nut ervan is om een UNIEKE uiteindelijke uitkomst te krijgen. Daar ben je namelijk naar op zoek. Dus blijft mijn allereerste punt staan, waarom begin je dan met random, en niet meteen gewoon met iets unieks. Ben je direct van alle gezeur af. Tenzij het verschil tussen random en uniek nog steeds niet duidelijk is natuurlijk...
Chris NVT op 04/05/2012 09:30:45:
Om de kans nog kleiner te maken
Om de kans nul te maken gebruik je dus gewoon direct een uniek getal. Niet random dus.
Leg me nu eens uit waarom je strak vast blijft houden een random iets terwijl je je daarna in allerlei bochten moet wringen om dat dan weer uniek te maken? Klinkt mij nog steeds niet logisch in de oren.
Gebruik bijv. de tijd functie van php, altijd uniek.
Erwin H op 04/05/2012 09:38:45:
Als jij een gewone random generator gebruikt (rand in php) dan genereer je een getal, niet een aantal characters. Dus het aantal cijfers dat je krijgt is niet constant.
Uiteraard kan je het allemaal anders doen.... maar het enige nut ervan is om een UNIEKE uiteindelijke uitkomst te krijgen. Daar ben je namelijk naar op zoek. Dus blijft mijn allereerste punt staan, waarom begin je dan met random, en niet meteen gewoon met iets unieks. Ben je direct van alle gezeur af. Tenzij het verschil tussen random en uniek nog steeds niet duidelijk is natuurlijk...
Om de kans nul te maken gebruik je dus gewoon direct een uniek getal. Niet random dus.
Leg me nu eens uit waarom je strak vast blijft houden een random iets terwijl je je daarna in allerlei bochten moet wringen om dat dan weer uniek te maken? Klinkt mij nog steeds niet logisch in de oren.
Uiteraard kan je het allemaal anders doen.... maar het enige nut ervan is om een UNIEKE uiteindelijke uitkomst te krijgen. Daar ben je namelijk naar op zoek. Dus blijft mijn allereerste punt staan, waarom begin je dan met random, en niet meteen gewoon met iets unieks. Ben je direct van alle gezeur af. Tenzij het verschil tussen random en uniek nog steeds niet duidelijk is natuurlijk...
Chris NVT op 04/05/2012 09:30:45:
Om de kans nog kleiner te maken
Om de kans nul te maken gebruik je dus gewoon direct een uniek getal. Niet random dus.
Leg me nu eens uit waarom je strak vast blijft houden een random iets terwijl je je daarna in allerlei bochten moet wringen om dat dan weer uniek te maken? Klinkt mij nog steeds niet logisch in de oren.
Waar zeg ik dat rand karakters genereerd? Ik heb het over hash niet rand.
Waarom krijg ik mijn premie van de CZ niet terug als ik niets claim? Er zijn zoveel dingen die niet logisch zijn, dat betekent niet dat het niet toegepast hoeft te worden.
Ook hier leer je van, mocht je in de toekomst wel 'random' dingen nodig hebben of iets willen 'hashen' dan heb je al iets gemaakt en ken je de basis.
Toevoeging op 04/05/2012 09:44:10:
Gerhard l op 04/05/2012 09:42:00:
Gebruik bijv. de tijd functie van php, altijd uniek.
Juist dat gebruiken de meeste in combi met een 'random' maarja ik had van Erwin wel verwacht dat hij dat zou snappen.
Maar goed.
Chris NVT op 04/05/2012 09:42:34:
Waar zeg ik dat rand karakters genereerd? Ik heb het over hash niet rand.
nu begrijp ik je echt niet meer. In je eerste voorbeeld geef je dit:
Quote:
Originele naam: Afb001.jpg
Met random nummer: 492381739Afb001.jpg
Nadat de random nummer+naam is gehashed: 857d39f7.jpg
Met random nummer: 492381739Afb001.jpg
Nadat de random nummer+naam is gehashed: 857d39f7.jpg
Ik zie daar dus een random nummer. Als dat gewoon gegenereerd is met rand van php dan kan dat 1 opleveren, of 1282347, maar geen 000001. Daar doel ik dus op. Daarmee kan je dus dezelfde uitkomsten krijgen, zelfs als je die random waarde uniek weet te krijgen.
Chris NVT op 04/05/2012 09:42:34:
Juist dat gebruiken de meeste in combi met een 'random' maarja ik had van Erwin wel verwacht dat hij dat zou snappen.
In de eerste plaats heb jij hierboven het nog nergens over een tijd gehad, dus als je daar op doelt wil ik je vragen voortaan iets duidelijker te zijn. Ten tweede begrijp ik dan nog steeds niet waarom je een random waarde eraan wilt toevoegen en mijn vraag om je redenering erachter te geven blijft dus staan. Waar je namelijk naar op zoek bent is iets unieks, niet random.
Erwin H op 04/05/2012 09:54:31:
nu begrijp ik je echt niet meer. In je eerste voorbeeld geef je dit:
Ik zie daar dus een random nummer. Als dat gewoon gegenereerd is met rand van php dan kan dat 1 opleveren, of 1282347, maar geen 000001. Daar doel ik dus op. Daarmee kan je dus dezelfde uitkomsten krijgen, zelfs als je die random waarde uniek weet te krijgen.
In de eerste plaats heb jij hierboven het nog nergens over een tijd gehad, dus als je daar op doelt wil ik je vragen voortaan iets duidelijker te zijn. Ten tweede begrijp ik dan nog steeds niet waarom je een random waarde eraan wilt toevoegen en mijn vraag om je redenering erachter te geven blijft dus staan. Waar je namelijk naar op zoek bent is iets unieks, niet random.
Chris NVT op 04/05/2012 09:42:34:
Waar zeg ik dat rand karakters genereerd? Ik heb het over hash niet rand.
nu begrijp ik je echt niet meer. In je eerste voorbeeld geef je dit:
Quote:
Originele naam: Afb001.jpg
Met random nummer: 492381739Afb001.jpg
Nadat de random nummer+naam is gehashed: 857d39f7.jpg
Met random nummer: 492381739Afb001.jpg
Nadat de random nummer+naam is gehashed: 857d39f7.jpg
Ik zie daar dus een random nummer. Als dat gewoon gegenereerd is met rand van php dan kan dat 1 opleveren, of 1282347, maar geen 000001. Daar doel ik dus op. Daarmee kan je dus dezelfde uitkomsten krijgen, zelfs als je die random waarde uniek weet te krijgen.
Chris NVT op 04/05/2012 09:42:34:
Juist dat gebruiken de meeste in combi met een 'random' maarja ik had van Erwin wel verwacht dat hij dat zou snappen.
In de eerste plaats heb jij hierboven het nog nergens over een tijd gehad, dus als je daar op doelt wil ik je vragen voortaan iets duidelijker te zijn. Ten tweede begrijp ik dan nog steeds niet waarom je een random waarde eraan wilt toevoegen en mijn vraag om je redenering erachter te geven blijft dus staan. Waar je namelijk naar op zoek bent is iets unieks, niet random.
Quote alsjeblieft een stukje waar ik rand gebruik.
Dit is een help forum, ik kan natuurlijk ook gewoon alles voorkauwen en hier uitspugen. Echter hier leert men niets van, we geven tips, ideeen, advies en soms idd 'voorbeeld' code.
Met een beetje logisch denken kom je een heel eind.
Quote:
I couldn't find a suitable random alpha-numeric generator function so I rolled my own. It gives a random number in base 36 (0-9, a-z) to a given length.
hopefully helps someone
Code (php)
1
2
3
4
5
6
7
8
9
10
11
12
2
3
4
5
6
7
8
9
10
11
12
<?php
function randomAlphaNum($length){
$rangeMin = pow(36, $length-1); //smallest number to give length digits in base 36
$rangeMax = pow(36, $length)-1; //largest number to give length digits in base 36
$base10Rand = mt_rand($rangeMin, $rangeMax); //get the random number
$newRand = base_convert($base10Rand, 10, 36); //convert it
return $newRand; //spit it out
}
?>
function randomAlphaNum($length){
$rangeMin = pow(36, $length-1); //smallest number to give length digits in base 36
$rangeMax = pow(36, $length)-1; //largest number to give length digits in base 36
$base10Rand = mt_rand($rangeMin, $rangeMax); //get the random number
$newRand = base_convert($base10Rand, 10, 36); //convert it
return $newRand; //spit it out
}
?>
hopefully helps someone
Source is de rand() PHP.net pagina.
Je kunt dus vrij makkelijk een fixed aantal nummers genereren met rand.
Uiteraard kan je dan weer naar een manier zoeken om ervoor te zorgen dat dat nummer alsnog (min of meer) uniek wordt, maar waarom zou je? Je hebt al een 100% zeker unieke waarde en dat is je id in de database. Waarom dat niet gewoon gebruiken?
Dus Chris, alsjeblieft, leg me nu eens uit waarom je strak blijft vast houden aan het gebruik van een random waarde terwijl je op zoek bent naar iets unieks.
Erwin H op 04/05/2012 10:10:41:
Prima, ik ben het met je eens dat je dus een random waarde kunt genereren met een bepaald aantal karakters. Maar het blijft dus zo zijn dat het nummer dat je nu genereert en dat je volgende week genereert gelijk kan zijn. Als Pietje dus vandaag test.jpg upload en Jantje een ander bestand, maar met dezelfde naam test.jpg upload dan kunnen ze dus hetzelfde random getal krijgen. Dat betekent dus dat je uiteindelijk dezelfd random waarde + filenaam kunt krijgen en dus in de problemen kan komen. Dat is mijn hele punt.
Uiteraard kan je dan weer naar een manier zoeken om ervoor te zorgen dat dat nummer alsnog (min of meer) uniek wordt, maar waarom zou je? Je hebt al een 100% zeker unieke waarde en dat is je id in de database. Waarom dat niet gewoon gebruiken?
Dus Chris, alsjeblieft, leg me nu eens uit waarom je strak blijft vast houden aan het gebruik van een random waarde terwijl je op zoek bent naar iets unieks.
Uiteraard kan je dan weer naar een manier zoeken om ervoor te zorgen dat dat nummer alsnog (min of meer) uniek wordt, maar waarom zou je? Je hebt al een 100% zeker unieke waarde en dat is je id in de database. Waarom dat niet gewoon gebruiken?
Dus Chris, alsjeblieft, leg me nu eens uit waarom je strak blijft vast houden aan het gebruik van een random waarde terwijl je op zoek bent naar iets unieks.
Dus jij wil zeggen dat als ik een nummer genereer van 20 cijfers (gebruik makend van tijd/datum optie in PHP) de kans groot 'genoeg' is dat dit nummer dubbel voor gaat komen? Als je dit echt gelooft, dan voeg je toch een 'random' pepper & salt toe hoe groot is de kans nu?
Ik zeg nergens dat jou optie om de ID (unique increment) te gebruiken niet een valide oplossing is wel dan? Ik gaf alleen aan dat er ook andere manieren zijn, waarom kun je dat niet inzien?
Ik zeg nergens dat hij voor mijn optie noch voor jou optie moet gaan, hij moet gaan voor de optie die hem het beste ligt zo simpel.
Gewijzigd op 04/05/2012 10:21:05 door Chris PHP
Iedereen moet gewoon de oplossing gebruiken die ze willen. Jij, ik, de TS. Het is mijn perfectionisme dat ik een oplossing die 'in de meeste gevallen goed gaat' niet als een echte oplossing kan zien. En al helemaal niet als er een goede oplossing te bedenken valt die ook nog eens veel korter en sneller is.
Wat ik alleen nog steeds hoop is dat je me kan uitleggen waarom je naar random grijpt als je uniek bedoelt. Dit is waarschijnlijk ijdele hoop, maar toch. Ik zie dit namelijk veel gebeuren wat regelmatig ook tot zeer ongewenste situaties leidt. Ik hoopte nu eens van iemand te kunnen horen waarom, maar blijkbaar wil je dat niet zeggen. Jammer.