Ich würde es von der Sprache abhängig machen, ob ich Diphthonge als Phoneme sehe oder nicht. Im Deutschen und fast allen germanischen Sprachen würde ich sie als Phoneme sehen; in vielen Fällen verhalten sie sich genau wie Langvokale.
Man beachte zum Beispiel, wie in englischen Lehnwörtern im Deutschen das Phonem /eɪ/ je nach Sprecher zwischen [eː] und [ɛɪ̯] variiert.
Im Niederländischen gibt es das Ganze auch mit einheimischen Phonemen z.B. kann man
geen ("kein") als [ɣeɪn] oder [ɣeːn] aussprechen. Das zugrundeliegende Phonem ist definitiv ein Langvokal, die phonetische Realisierung kann ein Langvokal oder ein Diphthong sein.
Es gibt noch viele andere Phänomene wo der Diphthong nur in der phonetischen Realisieung auftaucht: z.B. wenn aus einem Vokal + Konsonant (phonemisch) in der phonetischen Realisierung ein Diphthong wird.
z.B. Im Standarddeutschen (vor allem nördlich des Mains)
/iːr/ -> [iːɐ̯] usw
oder die l-Vokalisierung z.B. im Berndeutschen:
/iːl/ -> [iːu̯]
Mein Lieblingsbeispiel für l-Vokalisierung ist
Schuld : /ʃʊld/ ->
[ʃʊu̯d̥] - den resultierenden Diphthong kenne ich aus keiner anderen Sprache :D