Plot box adalah tampilan grafis yang secara bersamaan menampilkan beberapa fitur     penting dari data, seperti lokasi atau tendensi sentral, penyebaran atau variabilitas, penyimpangan dari simetri, dan identifikasi pengamatan yang terletak sangat jauh dari sebagian besar data (pengamatan ini sering disebut “pencilan”). Box plot atau boxplot (juga dikenal sebagai diagram boxand-whisker) merupakan suatu box (kotak berbentuk bujur sangkar). Box plot adalah cara standar untuk menampilkan distribusi data berdasarkan lima rangkuman (minimum, kuartil pertama, median, kuartil ketiga, dan maksimum).

Box plot dapat diilustrasikan seperti Gambar 2. Dalam penggambarannya, box plot dapat diilustrasikan secara horizontal maupun vertikal.

Dalam box plot yang paling sederhana, persegi panjang tengah membentang kuartil pertama ke kuartil ketiga (interquartil range atau IQR). Nilai IQR dapat diperoleh menggunakan rumus sebagai berikut (Walpole, 1992:63). Segmen di dalam persegi panjang menunjukkan median, dan “kumis” di atas dan di bawah persegi panjang menunjukkan lokasi minimum dan maksimum. Data yang terletak antara pagar dalam (inner fence) dan pagar luar (outer fence) pantas dicurigai sebagai outliers. Data yang berada di luar outer fence harus sangat dicurigai sebagai outliers. Outliers adalah 3 × IQR atau lebih di atas kuartil ketiga atau 3 × IQR atau lebih di bawah kuartil pertama. Dugaan outliers adalah 1,5 x IQR atau lebih di atas kuartil ketiga atau 1,5 × IQR atau lebih di bawah kuartil pertama. Jika salah satu jenis outlier hadir, kumis di sisi yang sesuai diambil sampai 1,5 × IQR dari kuartil (pagar dalam) dari titik data maksimum atau minimum, dan titik data individual ditampilkan sebagai lingkaran yang tidak terisi (untuk dugaan outliers) atau lingkaran yang diisi (untuk outlier). Pagar luar adalah 3 × IQR dari kuartil (Hoffmann, 1991).

Deskripsi Data Melalui Box-Plot

Langkah awal dalam menganalisis data adalah mempelajari karakteristik dari data tersebut. Untuk itu, kita perlu mengetahui misalnya pemusatan dan penyebaran data dari nilai tengahnya, nilai ekstrim atau outliernya, dan beberapa pengukuran lainnya. Terdapat beberapa teknik untuk mempelajari karakteristik dan distribusi data tersebut. Boxplot adalah salah satu cara dalam statistik deskriptif untuk menggambarkan secara grafik dari data numeris melalui lima ukuran sebagai berikut:

  1. Nilai observasi terkecil
  2. Kuartil terendah atau kuartil pertama (Q1), yang memotong 25 % dari data terendah
  3. Median (Q2) atau nilai pertengahan
  4. Kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25 % dari data tertinggi
  5. Kuartil tertinggi atau kuartil ketiga (Q3), yang memotong 25 % dari data tertinggi

Garis horizontal bagian bawah box menyajikan kuartil pertama (Q1), sementara bagian atas menyajikan kuartil ketiga (Q3). Bagian dari box adalah bidang yang menyajikan interquartile range (IQR), atau bagian pertengahan dari 50 % observasi. Panjang box ditentukan oleh IQR ini. IQR adalah ukuran yang terkenal untuk mengukur penyebaran data. Semakin tinggi (jika boxplot vertikal) atau semakin lebar (jika boxplot horizontal) bidang IQR ini, menunjukkan data semakin menyebar.

  1. Garis tengah yang melewati box menyajikan median dari data. Median adalah ukuran yang terkenal untuk lokasi variabel (nilai pusat atau rata-rata)
  2. Garis yang memperpanjang box dinamakan dengan whiskers. Whiskers menunjukkan nilai yang lebih rendah dan lebih tinggi dari kumpulan data yang berada dalam IQR (kecuali outlier). Panjang garis Whisker bagian atas ini adalah kurang dari atau sama dengan Q3 + (1.5 x IQR). Panjang garis Whisker bagian bawah ini adalah lebih besar atau sama dengan Q1 – (1.5 x IQR). Masing-masing garis whisker dimulai dari akhir box.
  3. Nilai yang berada di atas atau dibawah whisker dinamakan nilai outlier atau ekstrim.

Suatu nilai dikatakan outlier jika:

Q3 + (1.5 x IQR) < outlier ≤ Q3 + (3 x IQR)

Atau

 Q1 – (1.5 x IQR) > outlier ≥ Q1 – (3 x IQR).

Tahapan Membuat Box Plot

  1. Hitung Kuartil 1, Kuartil 2, Kuartil 3, serta Jarak antar kuartil.
  2. Buat kotak dengan ujung-ujung kuartil 1 dan kuartil 3.
  3. Buat garis pada kuartil 2, sehingga kotak terbagi menjadi 2.
  4. Buat garis dari ujung dengan nilai kecil hingga 1.5 kali jarak antar kuartil.
  5. Buat garis dari ujung dengan nilai besar hingga 1.5 kali jarak antar kuartil.

EXAMPLE:

  1. Misalnya kita punya sekumpulan data berikut:

10 12 16 18 20 21 22 22 23 27 32

Penyelesaian:

n (Jumlah data) = 11

Min (Data terkecil) = 10

Max (Data terbesasr) = 32

Q1 (Letak Quartile 1 pada data) = 1(n+1)/4 = 1(11+1)/4 = 3

Q2 (Letak Quartile 2 pada data) = 2 (n+1)/4 = 2(11+1)/4 = 6

Q3 (Letak Quartile 3 pada data) = 3(n+1)/4 = 3(11+1)/4 = 9

Q1 = 3 = 16

Q2 = 6 = 21

Q3 = 9 = 23

Q3 – Q1 = 23 – 16 = 7

Syarat suatu nilai dikatakan outlier jika:

Q3 + (1.5 x IQR) < outlier ≤ Q3 + (3 x IQR)

Q1 – (1.5 x IQR) > outlier ≥ Q1 – (3 x IQR).

Selanjutnya, suatu nilai dikatakan ekstrim jika lebih besar dari Q3 + (3 x IQR) atau lebih kecil dari Q1 – (3 x IQR). Oleh karenanya, nilai outlier dalam kasus kita adalah jika: 33.5 < outlier ≤ 44 Atau 5.5 > outlier ≥ -5. Dan dikatakan memiliki nilai ekstrim jika ada nilai lebih besar dari 44 atau ada nilai yang lebih kecil dari -5. Berdasarkan pengamatan terlihat bahwa data contoh kita tidak memiliki nilai outlier maupun nilai ekstrim.

Tangga Transformasi Tukey

Tangga transormasi turkey  adalah suatu cara untuk mentransformasikan  data. Cara pemilihan  transformasi yang sesuai adalah dengan menyesuaikan kemencengan dari data dan kuat atau tidaknya kemencengan tersebut. Jadi tidak sebarangan dalam memilih nilai lamda. Terkadang diperlukan juga untuk mencoba beberapa nilai lamda hingga mendapat hasil transformasi yang paling baik. Tujuan transformasi data adalah sebagai berikut.

  1. Membuat sebaran distribusi data yang menceng kanan maupun kiri menjadi lebih simetris
  2. Membuat sebaran data dari box plot menjadi simetris
  3. Melinierkan kurva scatter plot
  4. Membuat titik-titik sebaran data pada scatter plot tersebar lebih mendatar.

Berikut adlaah gambar tangga transformasi turkey:

Semoga Bermanfaat.

Untuk melihat cara membuat box plot menggunakan MS. Excel dan R Studio dapat dilihat pada laman berikut ini.

 

Artikel Terkait

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan.