Параллельное сито Эратосфена — Java Multithreading

Я хотел написать решето Эратосфена, которое будет работать с использованием определенного количества потоков. Я понял, что это будет работать следующим образом: Для 2 потоков до 17. Поток-1 берет 2 и начинает удалять кратные 2 из списка. Параллельный поток-2 берет 3 и делает то же самое. После этого Thread-1 берет 5 (потому что в списке нет 4), а Thread-2 берет 7 и так далее, пока они не достигнут конца. Я написал следующий фрагмент кода:

private List<Integer> array = new ArrayList<Integer>();
private List<Integer> results = new ArrayList<Integer>();
public synchronized void run(){
    while(array.size() > 0){
        Integer tmp = array.get(0);
        for(int i = 1; i < array.size(); i++){
            if( (array.get(i).intValue() % tmp.intValue()) == 0)
                array.remove(i);
        }
        results.add(array.get(0));
        array.remove(0);
    }
}

public void setArray(int x){
    for(int i = 2; i < x; i++)
        array.add(Integer.valueOf(i));
}
public void printArray(){
    for(Integer i: results){
        System.out.println(i);
    }
}

Этот код работает, но я добавил "инструмент" измерения времени в свой основной класс:

ThreadTask task = new ThreadTask();
task.setArray(5000);
Long beg = new Date().getTime();
for(int i = 0; i < 3;i++){
    new Thread(task).start();
}
Long sleep = 1000L;
Thread.sleep(sleep);// I am sleeping main thread to wait until other Threads are done
task.printArray();
System.out.println("Time is "+(new Date().getTime()-beg-sleep));

Проблема в том, что выполнение этого с 2 потоками медленнее, чем с 1 потоком, а с 3 потоками медленнее, чем с 2 потоками. Может ли кто-нибудь объяснить мне, почему?

ИЗМЕНИТЬ:

В этом есть одна важная вещь. Мне не нужно, чтобы это было сделано так быстро, как это возможно. Мне нужно, чтобы он работал с потоками по одной причине. Мой учитель хочет сравнить время выполнения одной и той же программы с 1, 2 .. n потоками. Результаты должны выглядеть так, как показано на этом графике.

EDIT2:

Я переписал код следующим образом

private HashMap<Integer,Boolean> array = new HashMap<Integer,Boolean>();
private int counter = 1;
private int x;
public void run(){
    while(counter < x-1){
        do{
            counter++;
        }
        while( array.get(counter));
        int tmp = counter;
        for(int i = tmp; i < array.size(); i+=tmp){
            if( i!= tmp)
                array.put(i,true);
        }
        try{
        Thread.sleep(0L, 1);
        }
        catch (Exception e){}
    }
}

public void setArray(int x){
    this.x = x;
    for(int i = 2; i < x; i++)
        array.put(i, false);
}
public void printArray(){

    for(int i = 2; i < array.size();i++){
        if( !array.get(i))
        System.out.println(i);

    }
}

Теперь он использует HashMap, и вот как это работает:

  1. Заполните HashMap ключами от 2 до n и ложными значениями.
  2. Новый поток переходит в цикл while, основанный на переменной counter. Counter представляет текущий ключ.
  3. Увеличивайте счетчик при попрошайничестве, чтобы новые потоки не работали с counter ранее запущенным потоком.
  4. Поместите значение counter во временную переменную tmp, чтобы мы могли работать, даже когда другой поток увеличивает counter
  5. Переберите HashMap, увеличив i на tmp (на самом деле это перескакивание на умножение i) и установите их значения на true.
  6. Все ключи, имеющие значение true, игнорируются в методе печати. Также counter пропускает их при увеличении.

Проблема в том, что он по-прежнему работает медленнее с большим количеством потоков. Что случилось сейчас?


person nervosol    schedule 03.09.2013    source источник
comment
если _1_ является фактическим методом _2_ вашего _3_, то ваши два потока по существу работают последовательно, потому что метод синхронизирован, что предотвращает параллельную работу потоков (в чем смысл использования потоков!).   -  person Daniel Williams    schedule 04.09.2013
comment
Я думаю, есть проблема... Вы говорите, что Thread-1 занимает 5, потому что в списке нет 4. Это работает только с двумя потоками, потому что Thread-1 уже удалил 4. Но что, если потоков три? Как Thread-3 узнает, что нельзя брать 4, если он не уверен, что Thread-1 уже получил его? Я предполагаю, что он все еще будет работать, если Thread-3 начнется с 4, но он будет выполнять избыточную работу. Или же необходимо выполнить очень сложную синхронизацию, чтобы избежать такого состояния гонки. Я скептически отношусь к тому, что это подходящий алгоритм для параллельных потоков.   -  person assylias    schedule 04.09.2013
comment
Даже если вы заставите его работать, разделив работу между потоками, он никогда не будет очень быстрым, если вы обращаетесь к одной и той же структуре, будь то массив или что-то еще. Правильный подход к многопроцессорной обработке состоит в том, чтобы разделить сито на страницы разумного размера и назначить один поток для каждой страницы, объединяя результаты с использованием потока переднего плана. Это то, что я сделал на С# здесь для большей эффективности (сегментированные сита также намного эффективнее обращаются к памяти). Этот алгоритм можно легко перевести на Java, и он будет работать примерно с той же скоростью.   -  person ajb    schedule 04.09.2013
comment
Ваши выводы становятся все более неясными! ;-)   -  person GordonBGood    schedule 09.05.2016


Ответы (1)


Ошибка проще, чем я думал сначала. Все ваши потоки делают одно и то же, поэтому каждый поток выполняет больше работы. Чтобы многопоточная программа работала быстрее, вы должны разделить работу, которая должна выполняться одновременно.


Когда у вас есть один поток, обращающийся к структуре данных, он может находиться в самом быстром кеше одного ядра, использовать несколько потоков, и им необходимо координировать свои действия, а поскольку большая часть работы заключается в обновлении структуры данных, много времени уходит на это. потерян как накладные расходы. Это так, даже если ваша структура данных не является потокобезопасной и, вероятно, приведет к повреждению результата.

Кстати, обновление ArrayList очень дорого, а использование объектов коллекции также является накладным.

Вы получите гораздо более быстрый результат, используя BitSet и всего один поток.

public class BitSetSieveMain {
    private final BitSet set;
    private final int size;

    public BitSetSieveMain(int x) {
        size = x + 1;
        set = new BitSet(size);
        set.flip(2, size);
    }

    public static void main(String[] args) {
        for (int i = 0; i < 10; i++) {
            long start = System.nanoTime();
            BitSetSieveMain bitSetSieveMain = new BitSetSieveMain(5000);
            bitSetSieveMain.sieve();
            long time = System.nanoTime() - start;
            System.out.println(time / 1000 + " micro-seconds to perform " + bitSetSieveMain);
        }
    }

    public void sieve() {
        int i = 2;
        do {
            for (int j = i*2; j < size; j += i)
                set.clear(j);
            i = set.nextSetBit(i+1);
        } while (i > 0);
    }

    public String toString() {
        return set.toString();
    }
}

наконец печатает

Ваш метод запуска синхронизирован, поэтому одновременно может выполняться только 1 поток.

person Peter Lawrey    schedule 03.09.2013
comment
87 микросекунд на выполнение {2, 3, 5, 7, 11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79 , 83, 89, 97, 101, 103, 107, 109, 113, 127, 131, 137, 139, 149, 151, 157, 163, 167, 173, 179, 181, 191, 193, 197, 199, 211 , 223, 227, 229, 233, 239, 241, 251, 257, 263, 269, 271, 277, 281, 283, 293, 307, 311, 313, 317, 331, 337, 347, 349, 353, 359 , 367, 373, 379, 383, 389, 397, 401, 409, 419, 421, 431, 433, 439, 443, 449, 457, 461, 463, 467, 479, 487, 491, 499, 503, 509 , 521, 523, 541, 547, 557, 563, 569, 571, 577, 587, 593, 599, 601, 607, 613, 617, 619, 631, 641, 643, 647, 653, 659, 661, 673 , 677, 683, 691, 701, 709, 719, 727, 733, 739, 743, 751, 757, 761, 769, 773, 787, 797, 809, 811, 821, 823, 827, 829, 839, 853 , 857, 859, 863, 877, 881, 883, 887, 907, 911, 919, 929, 937, 941, 947, 953, 967, 971, 977, 983, 991, 997, 1009, 1013, 10219, 10219 , 1031, 1033, 1039, 1049, 1051, 1061, 1063, 1069, 1087, 1091, 1093, 1097, 1103, 1109, 1117, 1123, 1129, 1151, 1153, 1173, 1811, 1811 , 1193, 1201, 1213, 1217, 1223, 1229, 1231, 1237, 1249, 1259, 1277, 1279, 1259, 1277, 1279, 1283, 1289, 1291, 1297, 1301, 1303, 1307, 1319, 1321, 1327, 1361, 1367, 1373 , 1381, 1399, 1409, 1423, 1427, 1429, 1433, 1439, 1447, 1451, 1453, 1459, 1471, 1453, 1459, 1471, 1481, 1483, 1487, 1489, 1493, 1499, 1511, 1523, 1531, 1543, 1549, 1553 , 1559, 1567, 1571, 1579, 1583, 1597, 1601, 1607, 1609, 1613, 1619, 1621, 1627, 1619, 1657, 1627, 1637, 1657, 1663, 1667, 1669, 1693, 1697, 1699, 1709, 1721, 1723, 1733 , 1741, 1747, 1753, 1759, 1777, 1783, 1787, 1777, 1783, 1787, 1789, 1801, 1811, 1823, 1831, 1847, 1861, 1867, 1871, 1873, 1877, 1879, 1889, 1901, 1907, 1913, 1931, 1933 , 1949, 1951, 1973, 1979, 1951, 1973, 1979, 1987, 1993, 1997, 1999, 2003, 2011, 2017, 2027, 2029, 2039, 2053, 2063, 2069, 2053, 2063, 2069, 2081, 2083, 2087, 2089, 2099, 211, 211, 2129 , 2131, 2137, 2141, 214, 2153, 2141, 2143, 2153, 2161, 2179, 2203, 2207, 2213, 2221, 2237, 2239, 2243, 2251, 2267, 2269, 2273, 2281, 2287, 2293, 2297, 2309, 2311, 2333 , 2339, 2341, 2347, 2351, 2357, 2371, 2377, 2381, 2383, 2389, 2393, 2399, 2411, 2417, 2423, 2437, 24 41, 2447, 2459, 2467, 2473, 2477, 2503, 2521, 2531, 2539, 2543, 2549, 2551, 2557, 2579, 2591, 2593, 2609, 2617, 265,7, 2633, 266, 7, 7, 2433, 26 26 2671, 2677, 2683, 2697, 2689, 2693, 2699, 2707, 2711, 2713, 2719, 2729, 2713, 2741, 2749, 2753, 2741, 2749, 2753, 2767, 2777, 2789, 2791, 2797, 2801, 2803, 2819, 2833, 2837, 2843, 2851, 2857, 2861, 2879, 2887, 2897, 2903, 2909, 2917, 2927, 2939, 2917, 2927, 2939, 2953, 2957, 2963, 2969, 2971, 2999, 3001, 3011, 3019, 3023, 3037, 3041, 3049, 3061, 3067, 3079, 3083, 3089, 3109, 3119, 3121, 3137, 3163, 3167, 3169, 3181, 3187, 3191, 3203, 3209, 3217, 3221, 3229, 3251, 3253, 3257, 3259, 3271, 3299, 3301, 3307, 3313, 3319, 3323, 3329, 3319, 3323, 3329, 3331, 3343, 3347, 3359, 3361, 3371, 3373, 3389, 3391, 3407, 3413, 3433, 3449, 3457, 3461, 3463, 3467, 3461, 3463, 3467, 3469, 3491, 3499, 3511, 3517, 3527, 3529, 3533, 3539, 3549, 3533, 3539, 3541, 3547, 3557, 3559, 3571, 3581, 3583, 3593, 3607, 3613, 3617, 3623, 3631, 3637, 3643, 3659, 3671, 3673, 3677, 3691, 3697, 3701, 3709, 3719, 3727, 3733, 3739, 3761, 3767, 3769, 3779, 3793, 3797, 3803, 3821, 3823, 3821, 3823, 3833, 3847, 3851, 3853, 3863, 3877, 3881, 3889, 3907, 3911, 3917, 3919, 3923, 3929, 3931, 3943, 3947, 3967, 3943, 4001, 4003, 4007, 4013, 4019, 4021, 4027, 4049, 4051, 4057, 4073, 4079, 4091, 4093, 4099, 4111, 4127, 4129, 4133, 4139, 4153, 4157, 4159, 4177, 4201, 4211, 4217, 4219, 4229, 4231, 4241, 4243, 4241, 4243, 4253, 4259, 4261, 4271, 4273, 4283, 4289, 4297, 4327, 4337, 4339, 4349, 4357, 4363, 4373, 4391, 4397, 4409, 4421, 4423, 4441, 4447, 4451, 4457, 4451, 4457, 4463, 4481, 4483, 4493, 4507, 4513, 4493, 4507, 4523, 4517, 4519, 4523, 4547, 4549, 4561, 4567, 4583, 4591, 4597, 4603, 4621, 4637, 4639, 4643, 4649, 4649, 4649, 4651, 4657, 4663, 4673, 4679, 4691, 4703, 4721, 4723, 4729, 4733, 4751, 4759, 4783, 4787, 4789, 4793, 4799, 4789, 4793, 4799, 4801, 4813, 4817, 4831, 4861, 4871, 4877, 4889, 4903, 4909, 4919, 4931, 4933, 4937, 4943, 4951, 4957, 4967, 4969, 4973, 4987, 4993, 4999} - person assylias; 04.09.2013