Cara untuk mengkonversi String ke dan dari UTF8 byte array di Java

Question

Lebih

Question

Cara untuk mengkonversi String ke dan dari UTF8 byte array di Java

Di pulau Jawa, saya punya String dan saya ingin meng-encode sebagai byte array (dalam UTF8, atau beberapa lainnya encoding). Secara bergantian, saya memiliki sebuah array byte (di beberapa encoding) dan saya ingin mengubahnya menjadi Java String. Bagaimana cara melakukan konversi tersebut?

Alvin Wong

Pertanyaan edit 10 Januari 2013 в 6:58

java

Solution / Answer

2 Agustus 2010 в 9:53

Lebih

Berikut ini's solusi yang menghindari melakukan Charset lookup untuk setiap konversi:

import java.nio.charset.Charset;

private final Charset UTF8_CHARSET = Charset.forName("UTF-8");

String decodeUTF8(byte[] bytes) {
    return new String(bytes, UTF8_CHARSET);
}

byte[] encodeUTF8(String string) {
    return string.getBytes(UTF8_CHARSET);
}

M. Leonhard

Jawaban edit 3 Agustus 2010 в 5:02

92

0

Jorge Ferreira

18 September 2008 в 12:13

Lebih

String original = "hello world";
byte[] utf8Bytes = original.getBytes("UTF-8");

Marged

Jawaban edit 18 November 2015 в 12:53

17

0

paiego

19 Oktober 2013 в 8:38

Lebih

Saya tomcat7 implementasi adalah menerima string sebagai ISO-8859-1; meskipun kandungan-jenis permintaan HTTP. Berikut solusi yang bekerja untuk saya ketika mencoba untuk benar menafsirkan karakter seperti 'é' .

byte[] b1 = szP1.getBytes("ISO-8859-1");
System.out.println(b1.toString());

String szUT8 = new String(b1, "UTF-8");
System.out.println(szUT8);

Ketika mencoba untuk menginterpretasikan string US-ASCII, byte info wasn't ditafsirkan dengan benar.

b1 = szP1.getBytes("US-ASCII");
System.out.println(b1.toString());

12

0

vtor

11 Mei 2015 в 2:32

Lebih

Sebagai alternatif, StringUtils dari Apache Commons dapat digunakan.

 byte[] bytes = {(byte) 1};
 String convertedString = StringUtils.newStringUtf8(bytes);

atau

 String myString = "example";
 byte[] convertedBytes = StringUtils.getBytesUtf8(myString);

Jika anda memiliki non-standar set karakter, anda dapat menggunakan getBytesUnchecked() atau newString() dengan demikian.

7

0

Bouke Woudstra

1 Juli 2016 в 7:12

Lebih

Untuk decoding serangkaian byte ke normal string pesan saya akhirnya berhasil bekerja dengan encoding UTF-8 dengan kode ini:

/* Convert a list of UTF-8 numbers to a normal String
 * Usefull for decoding a jms message that is delivered as a sequence of bytes instead of plain text
 */
public String convertUtf8NumbersToString(String[] numbers){
    int length = numbers.length;
    byte[] data = new byte[length];

    for(int i = 0; i< length; i++){
        data[i] = Byte.parseByte(numbers[i]);
    }
    return new String(data, Charset.forName("UTF-8"));
}

2

0

Pacerier

14 Juli 2012 в 11:54

Lebih

Jika anda menggunakan 7-bit ASCII atau ISO-8859-1 (yang luar biasa format umum) maka anda don't harus membuat yang baru jawa.lang.String pada semua. It's jauh lebih tampak hanya melemparkan byte ke char:

Bekerja penuh contoh:

for (byte b : new byte[] { 43, 45, (byte) 215, (byte) 247 }) {
    char c = (char) b;
    System.out.print(c);
}

Jika anda tidak menggunakan extended-karakter suka Ä, Æ, Å, Ç, Ï, Ê dan dapat yakin bahwa hanya ditularkan nilai-nilai yang pertama 128 karakter Unicode, maka kode ini juga akan bekerja untuk UTF-8 dan extended ASCII (seperti cp-1252).

Pacerier

Jawaban edit 17 Juli 2012 в 12:31

1

0

Ran Adler

1 Juli 2013 в 9:30

Lebih

//query is your json   

 DefaultHttpClient httpClient = new DefaultHttpClient();
 HttpPost postRequest = new HttpPost("http://my.site/test/v1/product/search?qy=");

 StringEntity input = new StringEntity(query, "UTF-8");
 input.setContentType("application/json");
 postRequest.setEntity(input);   
 HttpResponse response=response = httpClient.execute(postRequest);

0

Макс Даниленко

12 Mei 2015 в 12:32

Lebih

Reader reader = new BufferedReader(
    new InputStreamReader(
        new ByteArrayInputStream(
            string.getBytes(StandardCharsets.UTF_8)), StandardCharsets.UTF_8));

Debosmit Ray

Jawaban edit 31 Maret 2016 в 10:15

0

jschober

12 Mei 2015 в 6:10

Lebih

Saya dapat't komentar tapi don't ingin memulai thread baru. Tapi ini isn't bekerja. Sederhana round trip:

byte[] b = new byte[]{ 0, 0, 0, -127 };  // 0x00000081
String s = new String(b,StandardCharsets.UTF_8); // UTF8 = 0x0000, 0x0000,  0x0000, 0xfffd
b = s.getBytes(StandardCharsets.UTF_8); // [0, 0, 0, -17, -65, -67] 0x000000efbfbd != 0x00000081

I'a butuh b[] array yang sama sebelum dan setelah pengkodean yang isn't (ini referer untuk jawaban pertama).

0

Nitish Raj

15 Januari 2016 в 12:18

Lebih

Charset UTF8_CHARSET = Charset.forName("UTF-8");
String strISO = "{\"name\":\"א\"}";
System.out.println(strISO);
byte[] b = strISO.getBytes();
for (byte c: b) {
    System.out.print("[" + c + "]");
}
String str = new String(b, UTF8_CHARSET);
System.out.println(str);

Debosmit Ray

Jawaban edit 31 Maret 2016 в 10:13

0

savio

19 Februari 2010 в 12:04

Lebih

sangat terlambat tapi aku hanya mengalami masalah ini dan ini adalah saya perbaiki:

private static String removeNonUtf8CompliantCharacters( final String inString ) {
    if (null == inString ) return null;
    byte[] byteArr = inString.getBytes();
    for ( int i=0; i < byteArr.length; i++ ) {
        byte ch= byteArr[i]; 
        // remove any characters outside the valid UTF-8 range as well as all control characters
        // except tabs and new lines
        if ( !( (ch > 31 && ch < 253 ) || ch == '\t' || ch == '\n' || ch == '\r') ) {
            byteArr[i]=' ';
        }
    }
    return new String( byteArr );
}

-9

0

Related communities 3

Programmer JAVA indonesia

1 934 pengguna

Buka telegram

jvmusergroup

429 pengguna

Bismillahirrohmanirohim. Perhatian! Grup ini merupakan ekspansi dari grup Forum Java Programmer Indonesia di Facebook. Silahkan berbagi pengalaman dan masalah seputar Java dan keluarganya. https://t.me/JVMIndonesia Admin : @hendisantika34

Buka telegram

Java Indonesia🇲🇨

157 pengguna

Programmer Java Indonesia. Grup ini digunakan untuk bertanya terkait materi belajar Java / fullstack Warning=> -dilarang promosi(izin adm -18+🔞 - berbicara sopan - no spam /boot Mohon ikut aturan grup belum di keluarkan

Buka telegram

Tambahkan pertanyaan

Kategori

Semua

Teknologi

Budaya / Rekreasi

Kehidupan / Seni

Ilmu Pengetahuan

Profesional

Bisnis

Pengguna

Semua

Baru

Populer

1

Ксения Комарова

Terdaftar 4 minggu yang lalu

2

Артур «Апер»

Terdaftar 2 bulan yang lalu

3

Viktor Malyutin

Terdaftar 2 bulan yang lalu

4

Viktor Malyutin

Terdaftar 2 bulan yang lalu

5

Syahputra Zhedenk

Terdaftar 2 bulan yang lalu

Anda punya pertanyaan? Tambahkan di situs dan dapatkan jawabannya secara instan

id.kzen.dev

mcherm · Accepted Answer · 2008-09-18T00:16:39+00:00

Konversi dari String ke byte[]:

String s = "some text here";
byte[] b = s.getBytes(StandardCharsets.UTF_8);

Mengkonversi dari byte[] untuk String:

byte[] b = {(byte) 99, (byte)97, (byte)116};
String s = new String(b, StandardCharsets.US_ASCII);

Anda harus, tentu saja, menggunakan pengkodean yang benar nama. Contoh saya menggunakan US-ASCII dan UTF-8, dua yang paling umum pengkodean.