Setiap pengelompokan terhadap objek apa pun harus memiliki dasar untuk
mengelompokkan. Kalau ada sekumpulan orang, kita mudah melakukan pengelompokan
berdasarkan jenis kelamin, hasilnya dua kelompok: pria dan wanita. Dalam
pengelompokan ini, dasar atau variabel yang digunakan adalah jenis kelamin.
Pengelompokan dengan memakai hanya satu variabel umumnya tidak memuaskan karena
tidak menggambarkan profil kelompok secara jelas. Jadi, agar profil kelompok lebih jelas,
kita dapat menambahkan variabel-variabel lain, misalnya usia, tingkat pendi-dikan,
pekerjaan, status perkawinan, dan lain-lain.
Sayangnya, dalam analisis cluster, pemilihan variabel-variabel yang dilibatkan tidak boleh
sembarangan. Aturan pertama, dengan variabel-variabel yang dilibatkan, peneliti dapat
membentuk kelompok-kelompok, yang bermanfaat dari segi bisnis maupun ilmu
pengetahuan. Tidak ada gunanya melakukan pengelompokan kalau hasilnya tidak
memberikan manfaat.
Dalam pemasaran, misalnya, tujuan dari segmentasi pasar adalah untuk mengenal
segmen-segmen yang efektif, sehingga perusahaan dapat memilih satu, beberapa atau
semua segmen sebagai pasar sasaran. Kalau tidak sesuai dengan sasaran peneliti,
penge-lompokan tidak berguna.
Aturan kedua, pilih variabel-variabel yang betul-betul dapat memberikan gambaran
tentang persamaan dalam kelompok dan perbedaan antar-kelompok. Kalau dalam sebuah
variabel level semua objek sama (extremely homogenous), maka variabel tersebut jangan
dipakai. Misalnya, kalau dalam sebuah populasi semua orang berusia 20 tahun, jangan
lagi libatkan variabel ‘usia’ untuk mengelompokkan populasi tersebut.
Sebuah variabel yang betul-betul tidak pernah sama di antara objek-objek (extremely
heterogenous), atau yang selalu berbeda dari objek yang satu dengan objek lainnya, juga
tidak bisa dipakai. Sebab, variabel demikian tidak akan pernah berkontribusi terhadap
kesamaan (similarity) yang dipakai sebagai dasar untuk melakukan pengelompokan
subjek.
