Intelligence as one of the individual abilities that is widely used in everyday life has been extensively studied and measured using psychological measurement tools. One of them is the Intelligenz Structure Test (IST). However, at this time IST has leakage through discussions made by many parties. Moreover, the process of IST adaptation to the Indonesian version which tends to translate each word allegedly results in a bias of meaning that can affect the validity of this measurement tools. Therefore, this study is aimed to evaluating the current quality of IST by testing the feasibility of the Indonesian version of IST items for verbal ability, namely SE (Satzergaenzung), WA (Wortauswahl), and AN (Analogien). Item Response Theory (IRT) is used as a research method. The data were collected from 2.064 participants who live in Bandung. The results of the analysis revealed that the SE, WA, and AN subtest are still valid. Based on 60 items analyzed, 71.67% of the items have good quality, i.e. 43 of the 60 items have estimation of discriminant (a) parameter is acceptable. In addition, based on the fit item statistics it was also known that 78.33% of significant items followed the IRT model. Furthermore, based on statistics of item fit, it is also known that 78.33% of items fit the IRT model. This shows that the Indonesian version of IST is still valid to be used particularly in measuring verbal comprehension (V) through 3 subtests (SE, WA, and AN). However, it is necessary to revise the items that have been infected with DIF, in which 25% of items were declared to have a gender bias. Inteligensi sebagai salah satu kemampuan individu yang banyak berperan dalam kehidupan sehari-hari telah banyak diteliti dan diukur menggunakan alat ukur psikologi. Salah satunya adalah Intelligenz Struktur Test (IST). Namun, saat ini IST telah mengalami kebocoran melalui pembahasan yang dibuat oleh banyak pihak. Selain itu, proses adaptasi IST ke bahasa Indonesia yang cenderung menerjemahkan setiap kata secara langsung diduga mengakibatkan terjadinya bias makna yang dapat mempengaruhi keabsahan alat ukur ini. Oleh karena itu, penelitian ini ditujukan untuk mengevaluasi kualitas terkini IST dengan menguji kelayakan butir soal IST Bahasa Indonesia untuk kemampuan verbal, yaitu SE (Satzergaenzung), WA (Wortauswahl), dan AN (Analogien). Item Response Theory (IRT) digunakan sebagai metode penelitian ini. Data penelitian ini diperoleh dari 2.064 partisipan yang berdomisili di kota Bandung. Adapun penelitian ini menunjukkan hasil bahwa subtes SE, WA, dan AN masih tergolong valid. Berdasarkan 60 item yang dianalisis, 71,67% item memiliki kualitas yang cukup baik, yaitu 43 dari 60 item memiliki estimasi daya beda yang dapat diterima. Selain itu, berdasarkan statistik item fit juga diketahui 78,33% item signifikan mengikuti model IRT. Hal ini menunjukkan bahwa IST Bahasa Indonesia masih valid untuk digunakan terutama dalam mengukur verbal comprehension (V) melalui 3 subtes (SE, WA, dan AN). Namun, perlu dilakukan revisi terhadap item soal yang terjangkit DIF, di mana 25% butir soal dinyatakan mempunyai bias jenis kelamin.