Kā no saraksta izdzēst dubultniekus, vienlaikus saglabājot secību?

Question

Vairāk

Question

Kā no saraksta izdzēst dubultniekus, vienlaikus saglabājot secību?

Vai ir iebūvēta programma, kas Python programmā noņem saraksta dublikātus, vienlaikus saglabājot secību? Es zinu, ka es varu izmantot kopu, lai noņemtu dubultniekus, bet tas iznīcina sākotnējo kārtību. Es arī zinu, ka varu izveidot savu, piemēram, šādu:

def uniq(input):
  output = []
  for x in input:
    if x not in output:
      output.append(x)
  return output

(Paldies unwind par šo koda paraugu.)

Bet es gribētu izmantot kādu iebūvētu vai pitoniskāku idiomu, ja iespējams.

Saistīts jautājums: Kāds ir ātrākais algoritms, lai no saraksta noņemtu dubultniekus tā, lai visi elementi būtu unikāli, saglabājot secību?.

martineau

Rediģēts jautājums 16pēcpusdienari0t aprīlī 2018 в 3:29

Programmēšana

python

list

unique

duplicates

Solution / Answer

Rafał Dowgird

26pēcpusdienari0t janvārī 2009 в 3:47

Vairāk

from itertools import groupby
[ key for key,_ in groupby(sortedList)]

Sarakstam pat nav jābūt sortētam, pietiekams nosacījums ir tas, ka vienādas vērtības ir sagrupētas kopā.

Edit: Es pieņēmu, ka "saglabāt kārtību" nozīmē, ka saraksts ir sakārtots. Ja tas tā nav, tad MizardX piedāvātais risinājums ir pareizais.

Kopienas rediģēšana: Tomēr šis ir viselegantākais veids, kā "saspiest dublējošos secīgos elementus vienā elementā".

ninjagecko

Rediģēta atbilde 13pēcpusdienari2t jūlijā 2011 в 10:45

23

0

code22

5pēcpusdienari4t augustā 2011 в 5:06

Vairāk

Ja jums ir nepieciešama viena līnijpārvadātāja, tad varbūt tas varētu palīdzēt:

reduce(lambda x, y: x + y if y[0] not in x else x, map(lambda x: [x],lst))

... vajadzētu strādāt, bet labot mani, ja es kļūdos

0

Pievienot jautājumu

Kategorijas

Viss

Tehnoloģija

Kultūra / atpūta

Dzīve / Māksla

Zinātne

Profesionāls

Uzņēmējdarbība

Lietotāji

Visi

Jauns

Populārs

1

Ксения Комарова

Reģistrēts pirms 1 mēneša

2

Артур «Апер»

Reģistrēts pirms 2 mēnešiem

3

Viktor Malyutin

Reģistrēts pirms 2 mēnešiem

4

Viktor Malyutin

Reģistrēts pirms 2 mēnešiem

5

Syahputra Zhedenk

Reģistrēts pirms 2 mēnešiem

Do you have a question? Add it on the site and get an answer instantly

en.kzen.dev

Markus Jarderot · Accepted Answer · 2009-01-26T15:47:01+00:00

Šeit jums ir dažas alternatīvas: http://www.peterbe.com/plog/uniqifiers-benchmark

Ātrākais:

def f7(seq):
    seen = set()
    seen_add = seen.add
    return [x for x in seq if not (x in seen or seen_add(x))]

Kāpēc seen.add tiek piešķirts seen_add, nevis vienkārši izsaukt seen.add? Python ir dinamiska valoda, un seen.add atrisināšana katrā iterācijā ir dārgāka nekā vietējā mainīgā atrisināšana. seen.add varētu būt mainījies starp iterācijām, un izpildes laiks nav pietiekami gudrs, lai to izslēgtu. Lai būtu drošs, tam ir jāpārbauda objekts katru reizi.

Ja jūs plānojat šo funkciju bieži izmantot vienai un tai pašai datu kopai, iespējams, labāk būtu izmantot sakārtotu kopu: http://code.activestate.com/recipes/528878/

O(1) ievietošana, dzēšana un locekļu pārbaude katrai operācijai.

(Neliela papildu piezīme: seen.add() vienmēr atgriež None, tāpēc iepriekš minētais or ir tikai kā veids, kā mēģināt atjaunināt kopu, nevis kā loģiskā testa neatņemama sastāvdaļa.))