1bit 是计算机中最小的数据单位,1bit 就对应一个高低电位。
1bit×8=1byte
1byte×1024=1KB(kilobyte)
1KB×1024=1MB(megabyte)
1MB×1024=1GB(gigabyte)
1GB×1024=1TB(terabyte)
1TB×1024=1PB(petabyte)
在 UTF-8 编码中
- 一个 US-ASCII 字符只需要 1byte
- 带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字符需要 2byte
- 其他语言(包括中日韩文字、东南亚文字、中东文字等)使用 3byte
- 极少数语言用 4byte