mySQL fråga
-
- Inlägg: 7810
- Blev medlem: 26 maj 2009, 12:20:37
- Ort: Kristinehamn
mySQL fråga
Jag skall skapa en mySQL databas. Det var längesedan sist och jag minns inte vilken collation man skall välja. Det finns ju många att välja på. UTF8, UTF16 osv.
-
- Inlägg: 7810
- Blev medlem: 26 maj 2009, 12:20:37
- Ort: Kristinehamn
Re: mySQL fråga
Rätt och rätt, det beror ju lite på hur systemet ska användas. Men UTF8 är väldigt praktiskt, för de flesta tecken tar det bara en byte per tecken, men ändå klarar det UNICODE vid behov.
UTF16 tar väl i princip dubbelt så stor plats som UTF8, men vet inte om det är snabbare t.ex. vid sökningar.
UTF16 tar väl i princip dubbelt så stor plats som UTF8, men vet inte om det är snabbare t.ex. vid sökningar.
Re: mySQL fråga
Jag flikar in med alltid utf-8 när du har valet. Men se till att det är riktig utf-8
https://medium.com/@adamhooper/in-mysql ... 761243e434
https://medium.com/@adamhooper/in-mysql ... 761243e434
Re: mySQL fråga
UTF-8 känns som standard att man kör idag med det mesta. Frågan är om du behöver så mycket tecken
https://javarevisited.blogspot.com/2015 ... d-utf.html
Däremot läser du slutsatsen i ovan länk:
Summary
1) UTF16 is not fixed width. It uses 2 or 4 bytes. Only UTF32 is fixed-width and unfortunately no one uses it. Also, worth knowing is that Java Strings are represented using UTF-16 bit characters, earlier they use USC2, which is fixed width.
2) You might think that because UTF-8 take less bytes for many characters it would take less memory that UTF-16, well that really depends on what language the string is in. For non-European languages, UTF-8 requires more memory than UTF-16.
3) ASCII is strictly faster than multi-byte encoding scheme because less data to process = faster.
https://javarevisited.blogspot.com/2015 ... d-utf.html
Däremot läser du slutsatsen i ovan länk:
Summary
1) UTF16 is not fixed width. It uses 2 or 4 bytes. Only UTF32 is fixed-width and unfortunately no one uses it. Also, worth knowing is that Java Strings are represented using UTF-16 bit characters, earlier they use USC2, which is fixed width.
2) You might think that because UTF-8 take less bytes for many characters it would take less memory that UTF-16, well that really depends on what language the string is in. For non-European languages, UTF-8 requires more memory than UTF-16.
3) ASCII is strictly faster than multi-byte encoding scheme because less data to process = faster.